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FOREWORD 


“计算 机 组 成 原理 "和 * 计 算 机 系统 结构 ?是 计算 机 学 科 各 专业 的 核心 基础 课 。 有 些 高 校 
将 两 门 课程 分 开 来 上 ,也 有 些 高 校 针对 单 处 理 器 计算 机 系统 开设 一 门 “计算 机 组 成 与 系统 结 
构 ” 课 程 ,而 针对 多 核 处 理 器 、 多 处 理 机 、 并 行 处 理 机 等 高 级 体系 结构 专门 开设 一 门 “高 级 体 
系 结构 ”课程 。 不 管 如 何 设置 课程 ,计算 机 组 成 与 系统 结构 涉及 的 基本 内 容 都 是 一 样 的 ,这 
些 内 容 位 于 软 \ 硬 件 结合 处 ,不 仅 涉及 计算 机 硬件 设计 和 计算 机 指令 系统 设计 ,还 涉及 操作 
系统 ,编译 器 和 高 级 语言 程序 设计 等 部 分 软件 设计 技术 ,因此 ,相关 内 容 是 整个 计算 机 系统 
中 最 核心 的 部 分 。 

2015 年 8 月 ,由 清华 大 学 出 版 社 出 版 作者 编写 的 主教 材 (计算 机 组 成 与 系统 结构 (第 2 
版 )》, 主 要 针对 单 处 理 器 计算 机 系统 的 组 成 与 系统 结构 涉及 的 相关 内 容 进行 介绍 。 为 了 让 
学 生 能 够 更 好 地 理解 基本 概念 和 基本 原理 ,在 主教 材 编写 时 ,采用 了 “基本 原理 和 实现 细节 
相 结合 ,历史 发 展 过 程 和 现实 实际 情况 相 结合 ”的 方针 ,力求 使 学 生 能 够 全 面 、. 系 统 、 准 确 、 牢 
固 地 掌握 相关 知识 。 因 而 ,使 得 主教 材 的 内 容 涵 盖 面 广 ,细节 内 容 较 多 ,篇幅 较 大 ,给 教材 的 
使 用 带 来 一 些 困难 。 

为 了 更 好 地 协助 老师 用 好 主教 材 , 作 者 编写 了 本 辅助 教材 ,对 主教 材 中 每 一 章 的 内 容 进 
行 了 概括 总 结 , 给 出 了 以 下 6 个 方面 的 教学 辅助 内 容 。 

(1) 教学 目标 和 内 容 安排 : 给 出 相应 章节 的 教学 总 体 目标 和 基本 教学 要 求 ,并 较为 详 
细 地 说 明 课堂 教学 内 容 和 学 生 课 后 阅读 内 容 的 安排 ,以 及 每 章 的 主要 教学 思路 或 教学 方法 。 

(2) 主要 内 容 提要 : 对 主教 材 中 相应 章节 内 容 进 行 浓缩 ,形成 主干 知识 框架 结构 ,便于 
学 生 将 全 书 内 容 串 接 起 来 ,形成 本 课程 的 知识 框架 体系 。 

(3) 基本 术语 解释 : 给 出 相关 章节 所 涉及 的 基本 术语 的 解释 说 明 ,并 给 出 名 词 术语 的 
中 英文 对 照 。 

(4) 常见 问题 解答 : 提供 了 大 量 的 常见 问题 ,并 给 出 对 每 个 问题 的 解释 说 明 。 这 些 党 
见 问题 是 作者 在 长 期 的 教学 过 程 中 发 现 的 普遍 存在 于 学 生 中 的 共性 问题 。 

(5) 单项 选择 题 : 提供 了 相应 章节 内 容 的 单项 选择 题 及 其 参考 答案 ,并 对 部 分 习题 的 
答案 进行 分 析 解 答 。 

(6) 分 析 应 用 题 : 提供 了 相应 章节 内 容 的 分 析 应 用 题 及 其 分 析 解 答 。 

单项 选择 题 和 分 析 应 用 题 这 两 个 方面 的 教学 辅助 内 容 主要 是 为 了 巩固 学 生 所 学 的 基本 
原理 而 设置 的 。 通 过 对 一 些 具体 问题 的 分 析 , 能 够 提高 学 生 对 基本 原理 的 认识 。 

本 书 作为 主教 材 的 教学 辅助 资料 ,可 以 与 主教 材 配 套 使 用 。 同 时 ,本 书 相 对 独立 、 自 成 
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体系 ,因此 也 可 单独 使 用 , 既 可 作为 “计算 机 组 成 原理 ”或 “计算 机 组 成 与 系统 结构 ”课程 的 教 
师 参 考 书 , 也 可 作为 学 生 学 习 “ 计 算 机 组 成 原理 ”或 “计算 机 组 成 与 系统 结构 ”课程 时 的 学 习 
参考 书 。 

在 本 书 的 编写 过 程 中 ,得 到 了 杨 若 瑜 副教授 的 大 力 协助 ,从 书稿 的 篇 章 结构 到 内 容 各 方 
面 都 提出 了 许多 宝贵 的 意见 ,并 对 全 书 内 容 进 行 了 全 面 细致 的 核查 和 校对 。 此 外 , 黄 宜 华 教 
授 . 武 港 山 教授 等 也 对 本 书 提出 了 许多 宝贵 的 意见 。 杨 晓 亮 .省 码 、 翁 基 伟 、 刘 长 辉 . 宗 恒 、 莫 
志 刚 \ 叶 俊杰 等 研究 生 对 相关 章节 的 内 容 和 习题 分 别 进行 了 校对 和 试 做 ,并 提出 了 许多 宝贵 
的 意见 和 修改 建议 。 在 此 对 以 上 各 位 老师 和 研究 生 一 并 表示 衷心 感谢 。 

由 于 计算 机 组 成 与 系统 结构 相关 的 基础 理论 和 技术 在 不 断 发 展 ,新 的 思想 、 概 念 ,技术 
和 方法 不 断 涌 现 ,加 之 作者 水 平 有 限 ,在 编写 中 难免 存在 不 当 或 遗漏 之 处 ,恳请 同行 专家 和 
广大 读者 对 本 书 的 不 足 之 处 给 予 指正 ,以 便 在 后 续 的 版 本 中 予以 改进 。 在 主教 材 或 本 教材 
使 用 过 程 中 若 有 任何 问题 ,都 可 与 作者 直接 联系 ,联系 方式 : cfyuan@nju. edu. cn。 


作者 于 南京 
2016 年 3 月 
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计算 机 系统 概述 


1.1 教学 目标 和 内 容 安排 


主要 教学 目标 ; 概要 了 解 整个 计算 机 系统 全 瑶 以 及 本 课程 内 容 在 计算 机 系统 中 的 位 
置 ,并 使 学 生 掌握 如 何 简单 评价 计算 机 系统 的 性 能 。 

基本 学 习 要 求 : 

(1) 简单 了 解 计算 机 的 发 展 历程 .计算 机 分 代 标 志 、 摩 尔 定律 的 内 容 。 

(2) 了 解 计算 机 系统 中 硬件 和 软件 的 基本 概念 及 其 相互 关系 。 

(3) 了 解 冯 。 诺 依 曼 结 构 计算 机 的 特点 ,以 及 计算 机 硬件 的 基本 组 成 和 各 部 件 功能 。 

(4) 了 解 计算 机 软件 的 分 类 ,以 及 各 类 系统 软件 和 应 用 软件 的 功能 。 

(5) 了 解 程序 开发 和 执行 过 程 ,理解 各 种 语言 处 理 程序 (翻译 程序 编译 程序 汇编 程 
序 ) 的 概念 。 

(6) 理解 计算 机 系统 的 层次 化 结构 。 

(7) 了 解 各 类 计算 机 用 户 在 计算 机 系统 中 所 处 的 位 置 ,以 及 本 课程 在 计算 机 系统 中 所 
处 的 位 置 。 

(8) 了 解 如 何 对 计算 机 的 性 能 进行 测量 和 评价 。 

(9) 了 解 有 哪些 因素 会 影响 计算 机 的 性 能 。 


本 章 涉 及 的 内 容 是 计算 机 学 科 最 基本 的 概念 和 知识 ,虽然 没有 特别 难 懂 的 部 分 ,但 是 ， 
对 于 低 年 级 学 生来 说 ,有 些 概念 还 是 比较 抽象 和 难以 理解 的 ,需要 在 对 后 面 章节 的 不 断 学 习 
过 程 中 深化 对 它们 的 理解 并 熟练 运用 。 遇 到 这 些 内 容 时 ,可 以 告诉 学 生 相 关内 容 在 后 面具 
体 哪个 章节 中 会 详细 介绍 。 

有 关 计 算 机 发 展 历程 的 部 分 内 容 中 ,出 现 了 许多 学 生 难以 理解 的 专业 术语 ,因此 ,这 部 
分 内 容 可 以 跳 过 不 讲 , 但 是 ,对 于 冯 “， 诺 依 曼 计算 机 结构 的 特点 “存储 程序 工作 方式 “ 兼 
容 性 ?概念 .摩尔 定律 等 内 容 ,要 求学 生 能 够 掌握 和 理解 。 

计算 机 层次 化 概念 和 计算 机 系统 组 成 的 内 容 是 相互 联系 的 ,因为 不 同 计算 机 用 户 眼中 
的 计算 机 系统 是 不 一 样 的 。 可 以 从 最 终 用 户 感觉 到 的 计算 机 硬件 和 软件 的 形态 开始 ,逐步 
深入 到 系统 管理 员 ,应 用 程序 员 、 系 统 程序 员 以 及 系统 架构 师 眼中 的 硬件 和 软件 形态 。 这 两 
部 分 内 容 对 学 生 建 立 整 个 计算 机 系统 全 貌 以 及 了 解 本 课程 在 计算 机 系统 中 的 位 置 是 非常 重 
要 的 。 
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为 了 让 学 生 能 够 深入 理解 高 级 语言 源 程序 和 机 器 语言 目标 代码 之 间 的 关系 ,建议 让 学 
生 做 一 些 编程 实验 ,例如 ,可 以 让 学 生 对 主教 材 " 1. 4. 1 节 给 出 的 hello. < 源 程序 进行 编译 、 
链接 ,最 终生 成 可 执行 目标 代码 ,并 要 求学 生 比 较 源 程序 和 目标 代码 , 找 出 对 应 关系 ,并 找到 
函数 printf() 对 应 的 机 器 代码 段 等 。 


1.2 主要 内 容 提要 


1. 冯 “， 诺 依 曼 计 算 机 结构 的 主要 特点 

冯 “， 诺 依 曼 计算 机 结构 的 特点 主要 包括 : 计算 机 由 运算 器 ,控制 器 ,存储 器 ,输入 设 
备 和 输出 设备 5 大 部 分 组 成 ; 四 指令 和 数据 用 二 进 制 表示 ,两 者 形式 上 没有 差别 ; 指令 和 
数据 存放 在 存储 器 中 , 按 地 址 访问 ; @ 指 令 由 操作 码 和 地 址 码 组 成 ,操作 码 指定 操作 性 质 ， 
地 址 码 指定 操作 数 地 址 ; @ 采 用 ”存储 程序 "方式 进行 工作 。 

2. 计算 机 硬件 的 基本 组 成 和 功能 

运算 器 用 来 进行 各 种 算术 多 辑 运算 ;控制 器 用 来 对 指令 译 码 并 送出 操作 控制 信号 ;存储 
器 用 来 存放 指令 和 数据 ;输入 和 输出 设备 用 来 实现 计算 机 和 用 户 之 间 的 信息 交换 。 

3, 计算 机 系统 的 层次 结构 

计算 机 系统 分 软件 和 硬件 两 部 分 ,软件 和 硬件 的 界面 是 指令 集体 系 结构 (ISA)。 计 算 
机 系统 从 高 到 低 粗 分 为 应 用 软件 ,系统 软件 和 硬件 3 个 层次 ;不同 计算 机 用 户 工作 在 不 同 的 
层次 ,从 高 到 低 细 分 为 应 用 程序 级 (最 终 用 户 ) ,高 级 语言 虚拟 机 级 (高 级 语言 程序 员 或 应 用 
程序 员 ) ,汇编 语言 虚拟 机 级 (汇编 语言 程序 员 ) ,操作 系统 虚拟 机 级 (系统 管理 员 ) ,机 器 语言 
机 器 级 (机 器 语言 程序 员 ) 。 

4. 硬件 和 软件 的 相互 关系 

计算 机 硬件 和 软件 两 者 相辅相成 , 缺 一 不 可 。 两 者 都 用 来 实现 逻辑 功能 ,同一 功能 可 用 
硬件 实现 ,也 可 用 软件 实现 。 

5. 程序 开发 和 执行 过 程 

首先 用 某 种 语言 (高 级 语言 或 低级 语言 ) 编 制 源 程序 ;然后 用 语言 处 理 程序 (编译 程序 或 
汇编 程序 ) 将 源 程序 翻译 成 机 器 语言 目标 程序 。 通 过 某 种 方式 启动 目标 程序 (可 执行 代码 ) 
执行 时 ,操作 系统 将 指令 和 数据 装 和 内存, 然后 从 第 一 条 指令 开始 执行 。 每 条 指令 的 执行 过 
程 为 : 取 指令 ,指令 译 码 , 取 操作 数 , 运 算 , 送 结果 ,PC 指向 下 一 条 指令 。 可 执行 程序 由 若干 
指令 组 成 ,CPU 周而复始 地 执行 一 条 一 条 指令 ,直到 程序 所 含 指令 全 部 执行 完 。 

6. 基本 性 能 指标 和 性 能 参数 

计算 机 系统 的 基本 性 能 指标 包括 响应 时 间 和 香 吐 率 。 处 理 器 的 基本 性 能 参数 包括 时 钟 
周期 (或 主 频 ) .CPI、MIPS、MFLOPS( 或 GFLOPS、TFLOPS、PFLOPS 等 ) 。 

7. 性 能 的 测量 

一 般 把 程序 的 响应 时 间 划 分 成 CPU 时 间 和 等 待 时 间 ,CPU 时 间 又 分 成 用 户 CPU 时 间 
和 操作 系统 CPU 时 间 。 因 为 操作 系统 对 自身 所 用 的 时 间 进 行 测量 时 不 十 分 准确 ,所 以 ,对 
CPU 性 能 的 测量 一 般 是 通过 测量 程序 运行 时 的 用 户 CPU 时 间 来 进行 的 。 
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8. 各 种 性 能 参数 之 间 的 关系 

时 钟 周 期 和 时 钟 频率 互 为 倒数 。CPU 执行 时 间 可 用 “CPU 时 钟 周期 数 X 时 钟 周期 "来 
计算 。CPU 时 钟 周期 数 可 用 “程序 所 含 指令 条 数 X 程 序 的 CPI” 来 计算 。 

9. 性 能 评价 程序 

可 采用 一 组 性 能 评价 程序 ( 即 基准 程序 ) 对 机 器 性 能 进行 评测 。 有 些 机 器 制造 商会 针对 
基准 程序 中 频繁 出 现 的 语句 采用 专门 的 编译 器 进行 优化 ,使 基准 程序 的 运行 效率 大 幅 提 高 ， 
因此 有 时 用 基准 程序 得 到 的 评测 结果 不 能 说 明 问题 。 


1.3 基本 术语 解释 
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系列 机 (family machine) 

系列 机 是 指 一 个 厂家 生产 的 具有 相同 系统 结构 .不同 组 成 和 实现 的 一 系列 不 同型 号 的 
机 器 。 它 应 在 指令 系统 .数据 格式 .字符 编码 .中 断 系 统 、 输 入 输出 控制 方式 等 方面 保持 统 
一 ,从 而 保证 软件 的 兼容 性 。 

兼容 性 (compatibility) 

兼容 是 一 个 广泛 的 概念 ,主要 表示 一 种 “ 互 换 ” 特 性 ,包括 软件 兼容 .硬件 兼容 等 。 

软件 兼容 (software compatibility) 

指 在 某 档 机 型 上 开发 的 软件 可 以 不 加 修改 地 在 另外 的 机 型 上 正确 运行 。 一 般 在 同一 系 
列 机 内 的 软件 是 兼容 的 ,有 向 上 兼容 和 向 下 兼容 两 种 形式 。 向 上 兼容 是 指 高 档 机 型 上 的 程 
序 能 在 低档 机 型 上 运行 ,向 下 兼容 是 指 低档 机 型 上 的 程序 能 在 高 档 机 型 上 运行 ,一 般 系 列 机 
满足 向 下 兼容 性 。 因 为 系列 机 中 高 档 机 的 指令 系统 包含 了 低档 机 中 的 所 有 指令 。 

硬件 兼容 (hardware compatibility) 

也 就 是 设备 或 部 件 兼 容 , 是 指 设备 或 部 件 可 以 不 加 改动 地 用 于 多 种 计算 机 。 这 要 求 设 
备 或 部 件 符合 某 种 标准 化 设计 。 

小 规模 集成 电路 (Small Scale Integrated circuits,SSI circuits) 

集成 度 小 于 100 的 集成 电路 。 

中 规模 集成 电路 (Medium Scale Integrated circuits, MSI circuits) 

集成 度 在 100 到 1000 的 集成 电路 。 

大 规模 集成 电路 (Large Scale Integrated circuits, LSI circuits) 

集成 度 在 1000 到 10 万 的 集成 电路 。 

超大 规模 集成 电路 (Very Large Scale Integrated circuits, VLSI circuits) 

集成 度 在 10 万 到 1000 万 的 集成 电路 。 

极 大 规模 集成 电路 (Ultra Large Scale Integrated circuits, ULSI circuits) 

集成 度 在 1000 万 以 上 的 集成 电路 。 

摩尔 定律 (Moore’s law) 

1965 年 摩尔 预测 ,“ 以 后 每 年 将 缩小 硅 片 中 形成 晶体 管 电 路 的 细 线 尺寸 的 10% ,芯片 
制造 商 能 够 每 3 年 发 布 新 一 代 的 芯片 ,其 晶体 管 数 为 上 一 代 的 4 倍 .” 后 来 摩尔 定律 被 表述 
成 “由 于 集成 电路 技术 的 不 断 改 进 , 每 18 一 24 个 月 ,集成 电路 芯片 上 集成 的 晶体 管 数 将 翻 一 
番 , 速 度 将 提高 一 倍 ,而 价格 将 降低 一 半 。” 
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通用 电子 计算 机 (general-purpose electronic computer) 

通用 电子 计算 机 是 和 专用 电子 计算 机 对 应 的 ,专用 机 只 能 专门 用 于 某 种 应 用 ,而 通用 电 
子 计算 机 从 定义 上 来 说 可 以 解决 任何 问题 ,只 要 这 个 问题 可 以 用 程序 来 表示 。 通 用 电子 计 
算 机 也 被 称 为 完备 的 图 灵机 。 

算术 逻辑 单元 (Arithmetic Logic Unit, ALU) 

对 数据 进行 算术 运算 和 逻辑 运算 处 理 的 部 件 。 

数据 通路 (datapath) 

数据 通路 是 指 指令 在 执行 过 程 中 数据 所 经 过 的 部 件 以 及 部 件 之 间 的 连接 线路 ,主要 由 
ALU 和 一 组 寄存 器 .存储 器 ,总线 等 组 成 。 国 内 许多 教科 书 中 提 到 的 运算 器 即 是 运算 数据 
通路 。 

控制 器 (control unit) 

控制 器 也 称 为 控制 单元 或 控制 部 件 。 其 作用 是 对 指令 进行 译 码 ,将 译 码 结 果 和 状态 / 标 
志 信 号 ,时序 信号 等 进行 组 合 , 产 生 各 种 操作 控制 信号 。 这 些 操作 控制 信号 被 送 到 CPU 内 
部 或 通过 总 线 送 到 主 存 或 1/0 模块 。 送 到 CPU 内 部 的 控制 信号 用 于 控制 CPU 内 部 数据 
通路 的 执行 , 送 到 主 存 或 I/O 模块 的 信号 控制 CPU 和 主 存 或 CPU 和 I/O 模块 之 间 的 信息 
交换 。 控 制 单元 是 整个 CPU 的 指挥 控制 中 心 , 通 过 规定 各 部 件 在 何 时 做 什么 动作 来 控制 
数据 的 流动 ,完成 指令 的 执行 。 

中 央 处 理 器 (Central Processing Unit,CPU) 

中 央 处 理 器 是 计算 机 中 最 重要 的 部 分 之 一 ,主要 由 运算 器 和 控制 器 组 成 。 其 内 部 结构 
归纳 起 来 可 以 分 为 控制 部 件 .运算 部 件 和 存储 部 件 三 大 部 分 ,它们 相互 协调 ,共同 完成 对 指 
令 的 执行 。 

存储 器 (memory,storage) 

存储 器 用 于 存储 程序 和 数据 ,分 为 内 存储 器 (memory) 和 外 存储 器 (storage)。 内 存 存 
取 速 度 快 ,容量 小 ,价格 贵 ; 外 存 容量 大 ,价格 低 , 但 存 取 速 度 慢 。 

内 存 (memory) 

从 字面 上 来 说 ,内 存 是 内 部 存储 器 ,应 该 包括 主 存 (Main Memory,MM) 和 高 速 缓存 
(cache) ,但 是 ,因为 早期 计算 机 中 没有 高 速 缓存 ,因而 传统 意义 上 内 存 就 是 主 存 , 所 以 ,目前 
也 并 不 区 分 内 存 和 主 存 。 内 存 位 于 CPU 之 外 ,用 来 存放 已 被 启动 执行 的 程序 及 所 用 数据 ， 
包括 ROM 芯片 和 RAM 芯片 组 成 的 相应 ROM 存储 区 和 RAM 存储 区 两 部 分 。 

外 存 (storage) 

外 存储 器 主要 有 磁盘 存储 器 .磁带 存储 器 和 光盘 存储 器 等 。 磁 盘 是 最 常用 的 外 存储 器 ， 
通常 它 分 为 软盘 和 硬盘 两 类 。 容 量 极 大 、 价 格 便宜 的 磁带 机 和 光盘 组 等 称 为 海量 存储 器 , 常 
用 作 数 据 备份 ,也 称 为 辅 存 (Accessorial Memory, AM) 或 二 级 存储 器 (secondary memory) 。 

系统 软件 (system software) 

系统 软件 是 介 于 计算 机 硬件 与 应 用 程序 之 间 的 各 种 软件 , 它 与 具体 应 用 关系 不 大 。 系 
统 软件 包括 操作 系统 (如 Windows) ,语言 处 理 系统 (如 C 语言 编译 器 ) ,数据库 管 理 系统 (如 
Oracle) 和 各 类 实用 程序 (如 磁盘 碎片 整理 程序 、 备 份 程序 ) 。 

应 用 软件 (application software) 

应 用 软件 是 指 为 针对 使 用 者 的 某 种 应 用 目的 所 编写 的 软件 ,例如 办 公 自 动 化 软件 .互联 
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网 应 用 软件 ,多 媒体 处 理 软件 、 股 票 分 析 软 件 、 游 戏 软 件 、 管 理 信息 系统 等 。 

操作 系统 (Operating System,OS) 

操作 系统 是 计算 机 系统 中 负责 支撑 应 用 程序 运行 环境 以 及 用 户 操作 环境 的 系统 软件 ， 
其 目的 是 使 计算 机 系统 所 有 资源 最 大 限度 地 发 挥 作用 ,并 为 用 户 提供 方便 的 有效 的 友善 
的 服务 界面 。 操 作 系 统 是 一 个 庞大 的 管理 控制 程序 ,大 致 包括 5 个 方面 的 管理 功能 : 进程 
与 处 理 机 管理 ,作业 管理 ,存储 管理 ,设备 管理 和 文件 管理 。 目 前 比较 流行 的 操作 系统 主要 
有 两 个 家 族 : 类 UNIX 家 族 和 微软 公司 的 Windows 家 族 。 

最 终 用 户 (end user) 

使 用 应 用 程序 完成 特定 任务 的 计算 机 用 户 称 为 最 终 用 户 。 大 多 数 计算 机 使 用 者 都 属于 
最 终 用 户 。 例 如 ,使 用 炒股 软件 的 股民 、 玩 计算 机 游戏 的 人 、 进 行 会 计 电 算 化 处 理 的 财会 人 
员 等 等 。 

系统 管理 员 (system administrator) 

利用 操作 系统 提供 的 功能 对 系统 进行 配置 .管理 和 维护 以 建立 高 效 合理 的 系统 环境 供 
计算 机 用 户 使 用 的 操作 人 员 。 其 职责 主要 包括 : 安装 .配置 和 维护 系统 的 硬件 和 软件 ,建立 
和 管理 用 户 账户 ,升级 软件 ,备份 和 恢复 业务 系统 及 数据 等 。 

应 用 程序 员 (application programmer) 

使 用 高 级 编程 语言 编制 应 用 软件 的 程序 员 。 

系统 程序 员 (system programmer) 

设计 和 开发 系统 软件 的 程序 员 , 如 开发 操作 系统 ,编译 器 数据 库 管理 系统 等 系统 软件 
的 程序 员 。 

高 级 语言 (high-level programming language) 

高 级 语言 也 称 为 高 级 编程 语言 或 算法 语言 。 它 是 面向 问题 和 算法 的 描述 语言 。 用 这 种 
语言 编写 程序 时 ,程序 员 不 必 了 解 实际 机 器 的 结构 和 指令 系统 等 细节 ,而 通过 一 种 比较 自然 
的 、 直 接 的 方式 来 描述 问题 和 算法 。 

汇编 语言 (assembly language) 

汇编 语言 是 一 种 面向 实际 机 器 结构 的 低级 语言 ,是 机 器 语言 的 符号 表示 ,与 机 器 语言 一 
一 对 应 。 因 此 ,汇编 语言 程序 员 必 须 对 机 器 的 结构 和 指令 系统 等 细节 非常 清楚 。 

机 器 语言 (machine language) 

机 器 语言 是 指 直接 用 二 进 制 代码 (指令 ) 表 示 的 语言 。 用 户 必 须 用 二 进 制 代码 来 编写 机 
器 语言 程序 。 因 此 ,机 器 语言 程序 员 必 须 对 机 器 的 结构 和 指令 系统 等 细节 非常 清楚 。 

指令 集 (instruction set) 

一 台 计算 机 能 够 执行 的 所 有 机 器 指令 的 集合 。 指 令 按 功能 可 以 分 为 运算 指令 、 移 位 指 
令 、 传 送 指令 . 串 指令 ,程序 控制 指令 等 类 型 。 

指令 集体 系 结构 (Instruction Set Architecture,ISA) 

指令 集体 系 结构 是 计算 机 硬件 与 系统 软件 之 间 的 接口 , 指 机 器 语言 程序 员 或 操作 系统 、 
编译 器 .解释 器 设计 人 员 所 看 到 的 计算 机 功能 特性 和 概念 性 结构 。 其 核心 部 分 是 指令 系统 ， 
同时 还 包含 数据 类 型 和 数据 格式 定义 、 寄 存 器 组 织 .1/O 空间 的 编 址 和 数据 传输 方式 .中 断 
结构 ,计算 机 状态 的 定义 和 切换 ,存储 保护 等 。ISA 设计 的 好 坏 直 接 决定 了 计算 机 的 性 能 和 
成 本 。 
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透明 性 (transparency) 

由 于 计算 机 系统 采用 了 层次 化 结构 进行 设计 和 组 织 , 因 而 面向 不 同 的 硬件 或 软件 层面 
进行 工作 的 人 员 或 用 户 所 “看 到 ?的 计算 机 是 不 一 样 的 。 也 就 是 说 ,计算 机 组 织 方式 或 系统 
结构 中 的 一 部 分 对 某 些 用 户 而 言 是 “看 不 到 ”的 或 称 为 “透明 ”的 。 例 如 ,对 于 高 级 语言 程序 
员 来 说 ,指令 格式 .数据 格式 、 机 器 结构 .指令 和 数据 的 存 取 方式 等 都 是 透明 的 ;而 对 于 机 器 
语言 程序 员 和 汇编 语言 程序 员 来 说 ,指令 格式 、 机 器 结构 ,数据 格式 等 则 不 是 透明 的 。 

源 程序 (source program) 

编译 程序 ,解释 程序 和 汇编 程序 统称 为 语言 处 理 程序 。 各 种 语言 处 理 程序 处 理 的 对 象 
称 为 源 程序 ,用 高 级 (算法 ) 语 言 或 汇编 语言 编写 ,如 C 语言 源 程序 Java 语言 源 程序 .汇编 
语言 源 程序 等 。 

目标 程序 (object program) 

编译 程序 和 汇编 程序 对 源 程 序 进行 翻译 得 到 的 结果 程序 称 为 目标 程序 或 目标 代码 
(object code) 。 

编译 程序 (compiler) 

编译 程序 也 称 编译 器 ,是 用 来 将 高 级 语言 源 程序 翻译 成 汇编 语言 或 机 器 语言 目标 代码 
的 程序 。 

解释 程序 (interpreter) 

解释 程序 将 源 程序 的 一 条 语句 翻译 成 对 应 的 机 器 语言 目标 代码 ,并 立即 执行 ,然后 翻译 
下 一 条 源 程序 语句 并 执行 ,直至 源 程序 中 的 语句 全 部 被 翻译 并 执行 完 。 因 此 ,解释 程序 并 不 
输出 目标 程序 ,而 是 直接 输出 源 程序 的 执行 结果 。 

汇编 程序 (assembler) 

汇编 程序 也 是 一 种 语言 翻译 程序 , 它 把 汇编 语言 写 的 源 程序 翻译 为 机 器 语言 目标 程序 。 
汇编 程序 和 汇编 语言 是 两 个 不 同 的 概念 ,不 能 混为一谈 。 

响应 时 间 (response time) 

也 称 执行 时 间 (execution time) 或 等 待 时 间 (latency) ,是 指 从 作业 提交 开始 到 作业 完成 
的 时 间 。 一 般 一 个 程序 的 响应 时 间 除 了 CPU 执行 程序 包含 的 指令 执行 时 间 外 ,还 包括 等 
待 IO 的 时 间 ,系统 运行 其 他 用 户 程序 所 用 的 时 间 以 及 操作 系统 运行 的 时 间 等 。 

吞吐 率 (throughput) 

在 有 些 场合 下 ,吞吐 率 也 称 带宽 (bandwidth) ,是 指 在 一 定 的 时 间 内 所 完成 的 工作 量 。 

CPU 执行 时 间 (CPU execution time) 

也 称 为 CPU 时 间 (CPU time) ,是 指 在 程序 运行 过 程 中 ,CPU 真正 用 于 程序 执行 的 时 
间 。 它 不 包括 因为 等 待 1/O 操作 完成 所 需 的 时 间 , 也 不 包括 CPU 执行 其 他 程序 所 需 的 时 
间 。 对 用 户 来 说 ,能 直接 感觉 到 的 只 能 是 响应 时 间 ,而 不 可 能 是 CPU 执行 时 间 。 它 被 进 一 
步 分 为 两 部 分 。 一 部 分 是 用 来 运行 用 户 程序 代码 的 时 间 , 称 为 用 户 CPU 时 间 (user CPU 
time) ; 另 一 部 分 是 为 了 执行 用 户 程序 而 不 得 不 运行 的 一 些 操作 系统 代码 所 花费 的 时 间 , 称 
为 系统 CPU 时 间 (system CPU time)。 

系统 性 能 (system performance) 

通常 用 在 没有 任何 其 他 负载 的 情况 下 程序 的 响应 时 间 来 表示 系统 性 能 。 


计算 机 系统 在 达 


CPU 性 能 (CPU performance) 

通常 用 用 户 CPU 时 间 来 表示 CPU 性 能 。 

时 钟 周期 (clock cycle, tick, clock tick,clock) 

所 有 计算 机 执行 指令 的 过 程 都 是 分 成 若干 步骤 和 相应 的 动作 来 完成 的 ,每 一 步 动作 都 
要 有 相应 的 控制 信号 进行 控制 ,这 些 控制 信号 何 时 发 出 、 作 用 时 间 多 长 ,都 要 有 相应 的 定时 
信号 进行 同步 。 因 此 ,CPU 必须 能 够 获得 用 于 同步 的 时 钟 定时 信号 ,也 就 是 CPU 的 主 脉冲 
信号 ,其 宽度 称 为 时 钟 周 期 。 

时 钟 频率 (clock rate, 主 频 ) 

CPU 的 主 频 就 是 CPU 的 主 脉冲 时 钟 信号 的 频率 ,是 CPU 时 钟 周期 的 倒数 。 

CPI(Cycle Per Instruction) 

衡量 CPU 性 能 的 一 种 基本 参数 , 它 表示 执行 一 条 指令 所 需 的 平均 时 钟 周期 个 数 。 

基准 测试 程序 (benchmark) 

是 专门 用 来 进行 性 能 评价 的 一 组 程序 ,这 些 程序 能 够 很 好 地 反映 机 器 在 运行 实际 负载 
时 的 性 能 。 可 以 在 不 同 机 器 上 运行 相同 的 基准 测试 程序 来 比较 不 同 机 器 的 运行 时 间 , 从 而 
比较 其 性 能 。 

SPEC 基准 测试 程序 集 (SPEC benchmark) 

系统 性 能 评价 标准 SPEC(System Performance Evaluation Cooperative) 是 一 个 应 用 最 
广泛 ,也 是 最 全 面 的 对 CPU 性 能 进行 评测 的 基准 程序 集 。 分 整数 程序 集 SPECint 和 浮 点 
程序 集 SPECfp 等 。 

SPEC 比值 (SPEC ratio) 

将 测试 程序 在 Sun SPARCstation 上 运行 时 的 执行 时 间 除 以 该 程序 在 测试 机 器 上 的 执 
行 时 间 所 得 到 的 比值 。 比 值 越 大 ,机 器 的 性 能 越 好 。 

阿 姆 代 尔 定律 (Amdahl's law) 

主要 内 容 是 : 系统 优化 某 部 件 所 获得 的 系统 性 能 的 改善 程度 取决 于 该 部 件 被 使 用 的 频 
率 或 所 占 总 执行 时 间 的 比例 。 该 定律 很 好 地 刻画 了 改善 “系统 瓶颈 ”性 能 的 重要 性。 

MIPS(Million Instructions Per Second) 

用 来 衡量 单位 时 间 内 执行 指令 的 条 数 ,具体 是 指 每 秒 钟 执行 多 少 百 万 条 指令 。 

加 法 指令 执行 速度 (add instruction execution speed) 

最 早 用 来 衡量 计算 机 性 能 的 指标 是 完成 单个 运算 (如 加 法 运算 ) 指 令 所 需要 的 时 间 。 当 
时 大 多 数 指令 的 执行 时 间 是 相同 的 ,加 法 指令 能 反映 乘 、 除 等 运算 ,而 其 他 指令 的 时 间 也 大 
体 与 加 法 指令 相当 , 故 加 法 指令 的 速度 有 一 定 的 代表 性 。 计 量 单位 为 KIPS( 每 秒 千 条 指令 ) 
和 MIPS( 每 秒 百 万 条 指令 ) 。 

平均 指令 执行 时 间 (average instruction execution time) 

也 称 等 效 指令 速度 法 或 Gibson 混合 法 。 随 着 计算 机 的 发 展 ,不 同 指令 所 需 的 执行 时 间 
差别 越 来 越 大 ,人 们 就 根据 等 效 指令 速度 法 通过 统计 各 类 指令 在 程序 中 所 占 比 例 进行 折算 。 
设 某 类 指令 i 在 程序 中 所 占 比 例 为 ww; ,执行 时 间 为 1;, 则 等 效 指令 的 执行 时 间 为 : 了 一 zo X 
五 十 ro Xts 十 … 十 tw Xn 为 指令 种 类 数 )。 如 果 指 令 执 行 时 间 用 时 钟 周期 数 来 衡量 ,平均 
指令 执行 时 间 就 是 平均 CPI。 对 平均 指令 执行 时 间 求 倒数 能 够 得 到 平均 MIPS 值 。 
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峰值 MIPS(peak MIPS) 

选取 一 组 指令 组 合 , 使 得 平均 CPI 最 小 ,由 此 得 到 的 MIPS 就 是 峰值 MIPS。 有 些 制 造 
商 经 常 将 峰值 MIPS 直接 当 作 MIPS, 因 此 ,实际 上 的 性 能 要 比 标 称 的 性 能 差 。 

相对 MIPS(relative MIPS) 

根据 一 种 公认 的 参考 机 型 来 定义 相应 的 MIPS 值 ,其 值 的 含义 是 相对 于 参考 机 型 
MIPS 的 多 少 倍 。 

MFLOPS( Million Floating-point operations Per Second) 

是 计算 机 浮 点 运算 速度 的 一 种 计量 单位 。 表 示 每 秒 钟 执行 多 少 百 万 次 浮 点 操作 。 它 是 
基于 所 完成 的 单 精 度 浮 点 数 的 操作 次 数 而 不 是 指令 数 来 衡量 的 。 类 似 的 速度 单位 还 有 
GFLOPS(G 表示 10，)、TFLOPS(T 表示 10*)、PFLOPS(P 表示 10”)、EFLOPS(E 表示 
108) 等 。 


1.4 常见 问题 解答 


1. 计算 机 系统 就 是 硬件 系统 吗 ? 

答 : 说 计算 机 系统 就 是 硬件 系统 是 不 完整 的 。 一 个 完整 的 计算 机 系统 应 该 包括 硬件 系 
统 和 软件 系统 两 部 分 。 硬 件 系统 包括 运算 器 ,控制 器 ,存储 器 .输入 设备 和 输出 设备 五 大 基 
本 部 件 。 软 件 系统 分 为 系统 软件 和 应 用 软件 两 大 类 。 系 统 软件 包括 操作 系统 .计算 机 语言 
处 理 程序 (各 种 程序 翻译 软件 ,包括 编译 程序 .解释 程序 .汇编 程序 ) .服务 性 程序 ,数据库 管 
理 系统 和 网 络 软件 等 ;应 用 软件 包括 各 种 特定 领域 的 处 理 程序 。 计 算 机 系统 中 的 硬件 和 软 
件 是 相辅相成 的 , 缺 一 不 可 。 软 件 是 计算 机 系统 的 灵魂 ,没有 软件 的 硬件 不 能 被 用 户 使 用 ， 
犹如 一 堆 废 铁 。 

2. 同一 个 功能 可 以 由 软件 完成 也 可 以 由 硬件 完成 吗 ? 

答 : 软件 和 硬件 是 两 种 完全 不 同 的 形态 ,硬件 是 实体 ,是 物质 基础 ;软件 是 一 种 信息 ,看 
不 见 . 摸 不 到 。 但 是 它们 都 可 以 用 来 实现 逻辑 功能 ,所 以 在 逻辑 功能 上 ,软件 和 硬件 是 等 价 
的 。 因 此 ,在 计算 机 系统 中 ,许多 功能 既 可 以 直接 由 硬件 实现 ,也 可 以 在 硬件 的 配合 下 由 软 
件 来 实现 。 例 如 ,乘法 运算 既 可 以 用 专门 的 乘法 器 硬件 实现 , 即 机 器 提供 专门 的 一 条 乘法 指 
令 ; 也 可 以 用 乘法 子 程序 来 实现 , 即 不 提供 乘法 指令 ,而 由 加 法 指令 和 移 位 指令 等 组 成 的 一 
个 指令 序列 来 完成 乘法 运算 。 

3. 解释 程序 和 编译 程序 有 什么 差别 ? 

答 : 编译 程序 和 解释 程序 是 两 种 不 同 的 翻译 程序 。 两 者 的 不 同 在 于 : 编译 程序 将 高 级 
语言 源 程序 全 部 翻译 成 目标 程序 ,每 次 执行 程序 时 ,只 要 执行 目标 程序 ,因此 ,只 要 源 程序 不 
变 , 就 无 须 重新 翻译 ;解释 程序 是 将 源 程 序 的 一 条 语句 翻译 成 对 应 的 机 器 目标 代码 并 立即 执 
行 , 然 后 翻译 下 一 条 语句 并 执行 ,直至 所 有 源 程序 中 的 语句 全 部 被 翻译 并 执行 完 , 所 以 解释 
程序 的 执行 过 程 是 翻译 一 句 , 执 行 一 句 。 解 释 的 结果 是 源 程序 执行 的 结果 ,而 不 会 生成 目标 
程序 。 

4. 要 计算 机 做 的 任何 工作 都 要 先 编写 成 程序 才能 完成 吗 ? 

答 : 是 的 。 要 计算 机 完成 的 任何 事情 ,都 必须 先 编制 程序 ,程序 是 由 指令 构成 的 。 不 管 
是 用 哪 种 语言 编写 的 程序 ,最 终 都 要 翻译 成 机 器 语言 程序 才能 让 机 器 理解 ,机 器 语言 程序 是 
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由 一 条 一 条 指令 组 成 的 程序 。CPU 的 主要 功能 就 是 周而复始 地 执行 指令 ,因此 ,要 计算 机 
完成 的 所 有 功能 都 是 通过 执行 一 条 一 条 指令 来 实现 的 ,也 就 是 由 一 个 程序 来 完成 的 。 有 时 
我 们 说 某 个 特定 的 功能 是 由 硬件 实现 的 ,但 并 不 是 说 不 要 编写 程序 ,如 乘法 功能 可 由 乘法 器 
这 个 硬件 实现 ,但 要 启动 这 个 硬件 (乘法 器 ) 工 作 ,必须 先 执行 程序 中 的 乘法 指令 。 

5. 指令 和 数据 在 形式 上 没有 差别 , 且 都 存 于 存储 器 中 ,计算 机 如 何 区 分 它们 呢 ? 

答 : 指令 和 数据 在 计算 机 内 部 都 是 用 二 进 制 表示 的 ,因而 都 是 0.1 序列 ,在 形式 上 没有 
差别 。 在 指令 和 数据 取 到 CPU 之 前 ,它们 都 存放 在 存储 器 中 ,CPU 必须 能 够 区 分 读 出 的 是 
指令 还 是 数据 ,如 果 是 指令 ,CPU 会 把 指令 的 操作 码 送 到 指令 译 码 器 进行 译 码 ,而 把 指令 的 
地 址 码 送 到 相应 的 地 方 进行 处 理 ; 如 果 是 数据 , 则 送 到 寄存 器 或 运算 器 。 那 么 ,CPU 如 何 识 
别 读 出 的 是 指令 还 是 数据 呢 ? 实际 上 ,CPU 并 不 是 把 信息 从 主 存 读 出 后 , 靠 某 种 判断 方法 
来 识别 信息 是 数据 还 是 指令 的 。 而 是 在 读 出 之 前 就 知道 将 要 读 的 信息 是 数据 还 是 指令 了 。 
执行 指令 的 过 程 分 为 取 指 令 ,指令 译 码 、 取 操作 数 、 运 算 、 送 结果 等 。 所 以 ,在 取 指令 阶段 ,总 
是 根据 程序 计数 器 PC 的 值 去 取 指 令 , 所 以 取 来 的 一 定 是 指令 ; 取 操 作 数 阶段 取 来 的 一 定 是 
数据 。 

6. 衡量 计算 机 系统 性 能 的 主要 指标 是 什么 ? 

答 : 计算 机 性 能 的 好 坏 主 要 体现 在 速度 方面 ,而 衡量 速度 快慢 主要 有 两 个 指标 : 响应 
时 间 和 吞吐 率 。 响 应 时 间 是 指 从 作业 提交 开始 到 作业 完成 所 花 的 时 间 。 一 般 一 个 程序 的 响 
应 时 间 除 了 CPU 执行 该 程序 包含 的 指令 所 用 的 时 间 外 ,还 包括 等 待 输入 输出 操作 所 需 时 
间 和 操作 系统 运行 这 个 程序 所 花 的 时 间 开 销 等 。 吞 吐 率 是 指 单位 时 间 内 完成 的 工作 量 。 

7. CPU 的 时 钟 频 率 越 高 ,机 器 的 速度 就 越 快 , 对 吗 ? 

答 : 在 其 他 因素 不 变 的 情况 下 ,CPU 的 时 钟 频率 越 高 ,机 器 的 速度 肯定 越 快 。 但 是 ,程序 
执行 的 速度 除了 与 CPU 的 速度 有 关外 ,还 与 存储 器 1/O 等 模块 的 存 取 速 度 ,总线 的 传输 速 
度 ,cache 的 设计 策略 等 都 有 很 大 关系 。 因 此 ,机 器 的 速度 不 是 只 由 CPU 的 时 钟 频率 决定 。 

8. CPI 的 含义 是 什么 ”执行 时 间 ( 响 应 时 间 ) 与 CPI 是 什么 关系 ? 

答 , CPI 是 指 每 条 指令 执行 时 所 用 的 时 钟 周期 数 。 通 常 ,一 条 特定 指令 的 CPI 是 一 个 
确定 的 值 ,而 某 个 计算 机 或 程序 的 CPI 则 是 一 个 平均 值 。 一 个 程序 的 执行 时 间 取 决 于 该 程 
序 所 包含 的 指令 数 .CPI 和 时 钟 周期 。 在 指令 数 和 时 钟 周 期 一 定 的 情况 下 ,CPI 越 大 ,执行 
时 间 越 长 。 

9%. 用户 真正 感觉 到 的 程序 执行 时 间 是 否 就 是 执行 一 个 程序 中 所 有 指令 所 用 的 时 间 ? 

答 : 不 是 。 执 行 一 个 程序 中 所 有 指令 所 用 的 时 间 实际 上 比 用 户 真 正 感觉 到 的 程序 执行 
时 间 要 短 。 因 为 在 一 个 程序 执行 过 程 中 ,可 能 还 会 执行 操作 系统 代码 或 其 他 用 户 程序 ,并 
且 , 有 时 还 可 能 等 待 7O 操作 。 比 如 ,在 UNIX 操作 系统 中 ,假定 用 time 命令 测试 某 程序 执 
行 时 间 的 结果 为 80. 3u 10. 1s 2 : 02 74% , 则 说 明 该 程序 所 有 指令 的 执行 时 间 ( 即 用 户 CPU 
时 间 ) 只 有 80. 3s, 执 行 操作 系统 代码 所 用 时 间 ( 即 系统 CPU 时 间 ) 是 10. 1s, 用 户 感觉 到 的 
总 响应 时 间 为 2X60 十 2 二 122s, 其 中 的 (80. 3 十 10.1)/122= 二 74% 是 CPU 时 间 , 剩 下 26% 的 
时 间 ( 即 30 多 秒 ) 用 来 等 待 1/O 操作 或 运行 其 他 用 户 程序 。 

10. 计算 机 的 MIPS 数 越 大 ,说 明 性 能 越 好 ,对 吗 ? 

答 : 不 对 。MIPS 数 反映 的 是 机 器 执行 定点 指令 的 速度 。 但 是 ,不 同 机 器 的 指令 集 不 
同 , 指 令 的 功能 也 不 同 ,也 许 一 个 机 器 上 一 条 指令 的 功能 ,在 另外 一 个 机 器 上 要 用 多 条 指令 
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来 完成 ,这 样 ,同样 的 指令 条 数 所 完成 的 功能 可 能 完全 不 同 ;另外 ,不 同 机 器 的 CPI 和 时 钟 
周期 也 不 同 ,因而 一 条 指令 所 用 时 间 也 不 同 。 所 以 ,用 MIPS 数 来 对 不 同 的 机 器 进行 性 能 比 
较 是 不 太 客观 的 。 

11. 基准 测试 程序 执行 得 越 快 ,说 明 机 器 的 性 能 越 好 ,对 吗 ? 

答 : 不 对 。 一 般 情 况 下 ,基准 测试 程序 能 够 反映 机 器 性 能 的 好 坏 。 但 是 ,如 果 制 造 商 针 
对 基准 测试 程序 中 频繁 出 现 的 语句 采用 专门 的 编译 器 ,使 基准 程序 的 运行 效率 大 幅 提高 。 
那么 基准 测试 程序 的 测试 结果 就 不 能 说 明 问 题 。 


为 ( 


cn 


~ 


1.5 单项 选择 题 


.以 下 有 关 对 摩尔 定律 的 描述 中 ,错误 的 是 ( 。 )。 


A. 每 18 个 月 ,集成 电路 芯片 上 集成 的 晶体 管 数 将 翻 一 番 
B. 每 18 个 月 ,集成 电路 芯片 的 速度 将 提高 一 倍 
C. 每 18 个 月 ,集成 电路 芯片 的 价格 将 降低 一 半 
D. 集成 电路 技术 一 直 会 遵循 摩尔 定律 发 展 下 去 


. 从 计算 机 的 主要 元 器 件 来 看 ,计算 机 发 展 所 经 历 的 过 程 为 (  )。 


A. 晶体 管 .电子 管 .SSI、MSI、LSI、ULSI、VLSI 
B. 电子 管 ,晶体 管 ,SSI、MSI、LSI、VLSI、ULSI 
C. 电子 管 . 晶 体 管 .LSI.MSI.SSIVLSI.ULSI 
D. 晶体 管 , 电 子 管 .MSI.SSI.LSI.ULSIVLSI 


. 一 个 完整 的 计算 机 系统 包括 硬件 和 软件 。 软 件 又 分 为 (  )。 


A. 操作 系统 和 语言 处 理 程序 B. 系统 软件 和 应 用 软件 

C. 操作 系统 和 高 级 语言 D. 低级 语言 程序 和 高 级 语言 程序 
.以 下 给 出 的 软件 中 ,属于 应 用 软件 的 是 (。”)。 

A. 汇编 程序 B. 编译 程序 

C. 操作 系统 D. 文字 处 理 程序 
.以 下 给 出 的 软件 中 ,属于 系统 软件 的 是 (。”)。 

A. Windows XP B. MS Word 

C. 金山 词霸 D. RealPlayer 


. 下 面 有 关 指令 集体 系 结构 的 说 法 中 ,错误 的 是 ( 。 )。 


A. 指令 集体 系 结构 位 于 计算 机 软件 和 硬件 的 交界 面 上 

B. 指令 集体 系 结构 是 指 低级 语言 程序 员 所 看 到 的 概念 结构 和 功能 特性 
C. 程序 员 可 见 寄存 器 的 长 度 、 功 能 与 编号 不 属于 指令 集体 系 结构 的 内 容 
D. 指令 集体 系 结构 的 英文 缩写 是 ISA 


.计算 机 系统 采用 层次 化 结构 ,从 最 上 面 的 应 用 层 到 最 下 面 的 硬件 层 ,其 层次 化 构成 


i 

A. 高 级 语言 虚拟 机 一 操作 系统 虚拟 机 一 汇编 语言 虚拟 机 一 机 器 语言 机 器 
B. 高 级 语言 虚拟 机 一 汇编 语言 虚拟 机 一 机 器 语言 机 器 一 操作 系统 虚拟 机 
C. 高 级 语言 虚拟 机 一 汇编 语言 虚拟 机 一 操作 系统 虚拟 机 一 机 器 语言 机 器 


nr 


ul 
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D. 操作 系统 虚拟 机 一 高 级 语言 虚拟 机 一 汇编 语言 虚拟 机 一 机 器 语言 机 器 
8. 以 下 有 关 程 序 编写 和 执行 方面 的 叙述 中 ,错误 的 是 (。””)。 
A. 可 用 高 级 语言 和 低级 语言 编写 出 功能 等 价 的 程序 
B. 高 级 语言 和 汇编 语言 源 程序 都 不 能 在 机 器 上 直接 执行 
C. 编译 程序 员 必 须 了 解 机 器 结构 和 指令 系统 
D. 汇编 语言 是 一 种 与 机 器 结构 无 关 的 编程 语言 
9. 汉 “， 诺 依 曼 计算 机 中 ,CPU 区 分 从 存储 器 取出 的 是 指令 还 是 数据 的 依据 是 (。”)。 
A. 指令 译 码 结果 的 不 同 
B. 指令 和 数据 的 寻 址 方式 的 不 同 
C. 指令 和 数据 的 访问 阶段 的 不 同 
D. 指令 和 数据 所 在 的 存储 单元 的 不 同 
10. 以 下 是 有 关 冯 “， 诺 依 曼 结构 计算 机 中 指令 和 数据 表示 形式 的 叙述 ,其 中 正确 的 是 
%s 
A. 指令 和 数据 可 以 从 形式 上 加 以 区 分 
B. 指令 以 二 进 制 形式 存放 ,数据 以 十 进 制 形式 存放 
C. 指令 和 数据 都 以 二 进 制 形 式 存放 
D. 指令 和 数据 都 以 十 进 制 形 式 存放 
11. 以 下 是 有 关 计算 机 中 指令 和 数据 存放 位 置 的 叙述 ,其 中 正确 的 是 (  )。 
A. 指令 存放 在 内 存 , 数 据 存放 在 外 存 
B. 指令 和 数据 任何 时 候 都 存放 在 内 存 
C. 指令 和 数据 任何 时 候 都 存放 在 外 存 
D. 程序 被 启动 后 ,其 指令 和 数据 被 装 入 内 存 
12. 冯 ， 诺 依 曼 计算 机 工作 方式 的 基本 特点 是 (  )。 
A. 程序 一 边 被 输入 计算 机 一 边 被 执行 
B. 程序 直接 从 磁盘 读 到 CPU 执行 
C. 按 地 址 访问 指令 并 自动 按 序 执行 程序 
D. 程序 自动 执行 而 数据 手工 输入 
13. 以 下 是 有 关 冯 “， 诺 依 曼 计算 机 结构 的 叙述 ,其 中 错误 的 是 (  )。 
A. 计算 机 由 运算 器 ,控制 器 ,存储 器 和 输入 输出 设备 组 成 
B. 程序 由 指令 和 数据 构成 ,存放 在 存储 器 中 
C. 指令 由 操作 码 和 地 址 码 两 部 分 组 成 
D. 指令 按 地 址 访问 ,所 有 数据 在 指令 中 直接 给 出 
14. 以 下 有 关 计 算 机 各 部 件 功能 的 叙述 中 ,错误 的 是 (  )。 
A. 运算 器 用 来 完成 算术 运算 
B. 存储 器 用 来 存放 指令 和 数据 
C. 控制 器 通过 执行 指令 来 控制 整个 机 器 的 运行 
D. 输入 输出 设备 用 来 完成 用 户 和 计算 机 之 间 的 信息 交换 
15. 以 下 给 出 了 改善 计算 机 性 能 的 4 种 措施 : 
@ 用 更 快 的 处 理 器 来 蔡 换 原来 的 慢 速 处 理 器 。 
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@ 增加 同类 处 理 器 个 数 , 使 得 不 同 的 处 理 器 同时 执行 程序 。 
@ 优化 编译 生成 的 代码 ,使 得 程序 执行 的 总 时 钟 周 期 数 减 少 。 
@ 减少 指令 执行 过 程 中 访问 内 存 的 时 间 。 
对 于 某 个 特定 的 程序 ,以 上 措施 中 ,能 缩短 其 执行 时 间 的 措施 是 (  )。 
A. OD.@ 和 ® B. OQ 和 @ C. OD. 和 @ D. 全 部 
16. 若 某 典型 基准 测试 程序 在 机 器 A 上 运行 时 需要 20s, 而 在 机 器 B 上 的 运行 时 间 是 
16s, 那 么 ,相对 来 说 ,下 面 给 出 的 结论 中 正确 的 是 (  )。 
A. 所 有 程序 在 机 器 A 上 都 比 在 机 器 B 上 运行 速度 慢 
B. 机 器 B 的 速度 是 机 器 A 的 1.25 倍 
C. 机 器 A 的 速度 是 机 器 B 的 1.25 倍 
D. 机 器 A 比 机 器 B 慢 1.25 倍 
17. 已 知 计算 机 A 的 时 钟 频率 为 800MHz, 假 定 某 程序 在 计算 机 A 上 运行 需要 12s。 
现在 硬件 设计 人 员 想 设计 计算 机 B, 希 望 该 程序 在 B 上 的 运行 时 间 能 缩短 为 8s, 使 用 新 技术 
后 可 使 B 的 时 钟 频率 大 幅度 提高 ,但 在 B 上 运行 该 程序 所 需 的 时 钟 周期 数 为 在 A 上 的 1.5 
倍 。 那 么 ,机 器 B 的 时 钟 频率 至 少 应 为 多 少 才能 达到 所 希望 的 要 求 ?( 。 ) 
A. 800MHz B. 1.2GHz C. 1.5GHz D. 1.8GHz 
18. 假设 同一 套 指令 集 用 不 同 的 方法 设计 了 两 种 计算 机 A 和 B。 机 器 A 的 时 钟 周期 
为 1.2ns, 机 器 B 的 时 钟 周期 为 2ns。 某 个 程序 在 机 器 A 上 运行 时 的 CPI 为 2, 在 B 上 的 
CPI 为 1。 则 对 于 该 程序 来 说 ,机 器 A 和 机 器 B 之 间 的 速度 关系 为 (  )。 
A. 机 器 A 比 机 器 B 快 1.2 倍 
B. 机 器 B 比 机 器 A 快 1.2 倍 
C. 机 器 A 的 速度 是 机 器 B 的 1.2 倍 
D. 机 器 B 的 速度 是 机 器 A 的 1.2 售 
19. 假定 编译 器 对 高 级 语言 的 某 条 语句 可 以 编译 生成 两 种 不 同 的 指令 序列 ,A、B 和 C 
三 类 指令 的 CPI 和 两 种 不 同 序列 中 所 含 的 三 类 指令 的 条 数 见 表 1. 1。 
表 1.1 各 类 指令 的 CPI 及 指令 条 数 














指令 类 CPI 序列 一 的 指令 条 数 序列 二 的 指令 条 数 
A 1 2 4 
1 1 
© 3 2 1 











则 以 下 结论 中 错误 的 是 (。”)。 
A. 序列 一 比 序列 二 少 1 条 指令 
B. 序列 一 比 序列 二 的 执行 速度 快 
C. 序列 一 的 总 时 钟 周期 数 比 序列 二 多 1 个 
D. 序列 一 的 CPI 比 序列 二 的 CPI 大 
20. 假定 用 不 同 的 编译 器 对 同一 个 程序 进行 编译 生成 不 同 的 目标 代码 指令 序列 ,A、B 
和 C 三 类 指令 的 CPI 和 两 种 不 同 指令 序列 中 所 含 的 三 类 指令 条 数 见 表 1. 2。 
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表 1.2 各 类 指令 的 CPI 及 指令 条 数 











指令 类 CPI 序列 一 的 指令 条 数 序列 二 的 指令 条 数 
A i 5X10° 10X10? 
B 2 1X10 1X10? 
C 3 1X10 ii 











两 个 指令 序列 都 在 时 钟 周期 为 2ns 的 机 器 上 运行 。 根 据 计 算得 到 其 MIPS 指标 和 执行 
速度 两 方面 的 结论 为 (  )。 

A. 序列 一 的 MIPS 数 比 序列 二 多 50 ,序列 一 的 执行 速度 也 比 序列 二 快 10s 

B. 序列 二 的 MIPS 数 比 序列 一 多 50 ,但 序列 一 的 执行 速度 比 序列 二 快 10s 

C. 序列 一 的 MIPS 数 比 序列 一 多 100 ,序列 一 的 执行 速度 也 比 序列 二 快 20s 

D. 序列 二 的 MIPS 数 比 序列 一 多 100, 但 序列 一 的 执行 速度 比 序列 二 快 208 
【参考 答案 】 
1 0 :0 
lt.D 下 1D M.A 5D lB 1D 1D yb 20B 


1.6 分 析 应 用 题 


1. 请 说 明 以 下 措施 对 缩短 程序 的 响应 时 间 和 提高 系统 的 吞吐 率 各 有 什么 影响 。 

(1) 使 用 更 快 的 处 理 器 。 

(2) 增加 处 理 器 个 数 , 使 得 不 同 的 处 理 器 同时 执行 不 同 的 作业 。 

(3) 优化 编译 生成 的 代码 ,使 得 程序 执行 的 总 时 钟 周 期 数 减少 。 

(4) 在 CPU 和 主 存 之 间 增 加 cache, 减 少 访问 指令 和 数据 的 时 间 。 

【分 析 解 答 】 

措施 (1): 因为 总 执行 时 间 王 总 时 钟 周期 数 X 时 钟 周期 。 更 快 的 处 理 器 意味 着 时 钟 频 
率 加 快 了 , 即 每 个 时 钟 周期 更 短 了 , 故 总 执行 时 间 变 短 了 。 因 此 采用 更 快 的 处 理 器 可 缩短 程 
序 响应 时 间 , 从 而 使 单位 时 间 内 完成 的 作业 数 增加 ,系统 的 吞吐 率 也 提高 了 。 

措施 (2) : 处 理 器 个 数 的 增加 使 得 同时 可 以 有 多 个 作业 在 不 同 的 处 理 器 上 进行 处 理 , 因 
而 ,系统 在 单位 时 间 内 可 以 完成 更 多 的 作业 ,吞吐 率 会 明显 提高 。 但 每 个 作业 的 处 理 过 程 还 
是 一 样 的 ,所 以 程序 的 执行 时 间 并 不 会 缩短 。 但 是 ,因为 吞吐 率 提高 了 ,所 以 作业 在 等 待 队 
列 中 的 排队 时 间 减 少 了 ,因而 响应 时 间 会 在 一 定 的 程度 上 有 相应 的 改善 。 

措施 (3): 优化 编译 使 生成 的 代码 总 的 执行 时 钟 周期 数 减少 ,也 就 缩短 了 程序 的 执行 时 
间 , 因 而 使 得 单位 时 间 内 完成 的 作业 数 增加 ,提高 了 系统 的 吞吐 率 。 

措施 (4): 在 CPU 和 主 存 之 间 增加 cache, 使 得 程序 访问 存储 器 的 时 间 大 大 缩短 ,因而 
可 以 缩短 程序 的 响应 时 间 , 从 而 也 就 使 得 单位 时 间 内 完成 的 作业 数 增加 ,提高 了 系统 的 吞 
吐 率 。 

综 上 所 述 ,措施 (1)、(3) 和 (4) 是 因为 首先 缩短 了 程序 的 执行 时 间 而 使 得 系统 吞吐 率 提 
高 ;而 措施 (2) 是 因为 提高 了 系统 的 吞吐 率 , 使 得 程序 等 待 时 间 缩 短 而 缩短 了 程序 响应 时 间 。 
程序 响应 时 间 和 系统 吞吐 率 之 间 通 常 是 相辅相成 的 关系 ,但 在 某 些 特定 情况 下 ,它们 有 可 能 
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是 对 立 关 系 。 

2. 假定 某 程序 P 由 一 个 100 条 指令 构成 的 循环 组 成 ,该 循环 共 执 行 50 次 ,在 某 系统 S 
中 执行 程序 P 花 了 20000 个 时 钟 周期 , 则 系统 S 在 执行 程序 P 时 的 CPI 是 多 少 ? 

【分 析 解 答 】 

程序 P 中 100 条 指令 的 循环 被 执行 了 50 次 ,所 以 在 20000 个 时 钟 周期 中 共 执行 了 
5000 条 指令 ,所 以 ,系统 S 在 执行 程序 P 时 的 CPI==20000/5000=4。 

3. 假定 执行 某 种 指令 I 需要 20 个 时 钟 周 期 ,该 指令 在 程序 中 的 出 现 频 度 为 10% ,其 他 
所 有 指令 的 平均 CPI 为 5, 则 CPU 执行 指令 I 所 用 时 间 占 整个 CPU 时 间 的 百分比 是 多 少 ? 
如 果 通 过 对 硬件 进行 改进 ,能 使 指令 I 的 执行 时 间 缩 短 为 10 个 时 钟 周期 ,但 同时 会 使 CPU 
时 钟 周期 延长 10% ,你 认为 是 否 应 该 采取 这 种 改进 措施 ? 

【分 析 解 答 】 

假定 CPU 执行 的 所 有 指令 条 数 为 N, 时 钟 周期 为 全, 则 CPU 执行 总 时 间 为 (20 Xx 
10% 十 5X90%)XNXT, 其 中 指令 I 所 用 时 间 为 20X10%XNXT, 因 此 ,CPU 执行 指令 I 
所 用 时 间 占 整个 CPU 时 间 的 百分比 是 20X10%WXNXT/((20X10% 十 5X90%) XNX7T)= 
30.77%。 如 果 改 进 后 将 指令 I 的 执行 时 间 缩 短 为 10 个 时 钟 周期 ,时 钟 周期 的 长 度 延 长 
10%, 则 改进 后 CPU 执行 的 总 时 间 为 (10X10% 十 5X90%)XNX1.1XT=6.05XNXT， 
改进 前 的 总 时 间 为 (20X10% 十 5X90%)XNXT=6.5XNXT, 因 而 ,改进 后 的 性 能 是 改 
进 前 的 6. 5/6.05s:1.07 倍 。 由 此 可 见 , 对 硬件 的 这 种 改进 措施 能 够 提高 CPU 的 性 能 。 

4. 若 有 两 个 基准 测试 程序 P1 和 P2 在 机 器 M1 和 M2 上 运行 ,假定 ML 和 M2 的 价格 
分 别 是 5000 元 和 8000 元 , 表 1.3 给 出 了 P1 和 了 P2 在 Ml 和 M2 上 所 用 的 时 间 和 指令 条 数 。 


表 1.3 Pl 和 P2 在 Ml 和 M2 上 所 用 的 时 间 和 指令 条 数 


M1 M2 
程序 





指令 条 数 


执行 时 间 


指令 条 数 





Pl 


200X10° 


1000ms 


150X10° 





Pp2 





300X103 





3ms 





420X103 





请 回答 下 列 问题 。 

(1) 对 于 P1, 哪 台 机 器 的 速度 快 ? 快 多 少 ?对 于 P2 呢 ? 

(2) 在 M1 上 执行 Pl 和 P2 的 速度 分 别 是 多 少 MIPS? 在 M2 上 的 执行 速度 又 各 是 多 
少 ? 从 执行 速度 来 看 ,对 于 P2, 哪 台 机 器 的 速度 快 ? 快 多 少 ? 

(3) 假定 M1 和 M2 的 时 钟 频率 分 别 是 800MHz 和 1.2GHz, 则 在 M1 和 M2 上 执行 Pl 
时 的 平均 时 钟 周期 数 CPI 各 是 多 少 ? 

(4) 如 果菜 个 用 户 需 要 大 量 使 用 程序 P1, 并 且 该 用 户主 要 关心 系统 的 响应 时 间 而 不 是 
吞吐 率 ,那么 ,该 用 户 需 要 大 批 购 进 机 器 时 ,应 该 选择 M1 还 是 M2? 为 什么 ? (提示 : 从 性 
价 比 上 考虑 。) 

(5) 如 果 另 一 个 用 户 也 需要 购 进 大 批 机 器 ,但 该 用 户 使 用 P1 和 P2 一 样 多 ,主要 关心 的 
也 是 响应 时 间 ,那么 ,应 该 选择 Ml 还 是 M2? 为 什么 ? 

【分 析 解 答 】 

(1) 对 于 程序 P1, M1 所 花 的 执行 时 间 是 M2 的 2 倍 , 故 M2 比 M1 快 1 倍 ;对 于 程序 
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P2,M2 所 花 的 执行 时 间 是 M1 的 2 倍 , 故 M1 比 M2 快 1 售 。 

(2) 在 M1 上 Pl 的 速度 为 200/1= 二 200MIPS,P2 的 速度 为 0. 3/0. 003 二 100MIPS; 在 
M2 上 P1 的 速度 为 150/0. 5 二 300MIPS,P2 的 速度 为 0. 42/0. 006 王 70MIPS。 从 执行 速度 
来 看 ,对 于 P2 ,因为 100/70s*1.43, 所 以 Ml 比 M2 快 0.43 售 。 

(3) 在 M1 上 执行 Pl 时 的 平均 时 钟 周期 数 CPI 为 1X800/200=4; 在 M2 上 执行 P1 时 
的 平均 时 钟 周期 数 CPI 为 0.5X1200/150==4。 

(4) 考虑 运行 P1 时 M1 和 M2 的 性 价 比 , 因 为 该 用 户主 要 关心 系统 的 响应 时 间 , 所 以 
性 价 比 中 的 性 能 主要 考虑 执行 时 间 , 其 性 能 为 执行 时 间 的 倒数 。 故 性 价 比 为 R=1/ (执行 时 
间 X 价 格 )。R 越 大 说 明 性 价 比 越 高 , 即 , “执行 时 间 X 价 格 ” 的 值 越 小 , 则 性 价 比 越 高 。 

对 于 程序 P1, M1 的 性 价 比 为 R1 二 1/(1X5000) ,M2 的 性 价 比 为 R2==1/(0. 5 X8000)， 
根据 计算 ,可 知 R2 之 R1, 故 M2 的 性 价 比 高 ,应 选择 购买 M2。 

(5) 因为 P1 和 P2 需要 同等 考虑 ,所 以 需要 考虑 综合 性 能 。 有 多 种 计算 综合 性 能 的 方 
法 ,如 执行 时 间 总 和 ,执行 时 间 算 术 平 均值 .执行 时 间 几 何平 均值 等 。 

若 用 执行 时 间 总 和 , 则 MI 的 性 价 比 为 R1=1/(1003 X5000),M2 的 性 价 比 为 R2= 
1/(506X8000) ,显然 了 2 之 R1, 故 M2 的 性 价 比 高 ,应 选择 M2。 

若 用 算术 平均 值 , 则 M1、M2 上 执行 时 间 的 算术 平均 值 分 别 为 501. 5ms 和 253ms。 因 
此 ,M1 的 性 价 比 为 R1 = 二 1/(501. 5 X5000), M2 的 性 价 比 为 R2=1/(253X 8000), 显 然 
R2>>R1, 故 M2 的 性 价 比 高 ,应 选择 M2。 

若 用 几何 平均 值 , 则 M1、M2 上 执行 时 间 的 几何 平均 值 都 一 样 , 约 为 54.7。 因 此 , M1 
的 性 价 比 为 R1==1/(54.7X5000) ,M2 的 性 价 比 为 R2=1/(54.7X8000) ,显然 R1 之 R2 , 故 
M1 的 性 价 比 高 ,应 选择 M1。 

由 此 可 见 , 用 不 同 的 综合 性 能 计算 方法 得 到 的 结论 可 能 不 同 。 

5. 假定 MI 和 M2 是 以 不 同方 式 实现 同一 个 指令 集 的 两 种 机 器 , M1 的 时 钟 频率 为 
800MHz, M2 的 时 钟 频率 为 400MHz。 在 该 指令 集中 一 共有 A、B 和 C 三 类 指令 。 有 三 种 
不 同 的 编译 器 ,其 中 Cl 和 C2 分 别 是 Ml 和 M2 的 生产 厂商 提供 的 ,C3 是 第 三 方 编译 器 。 
假设 对 于 同一 个 程序 而 言 ,三 个 编译 器 生成 的 程序 代码 中 指令 总 数 相 等 ,但 是 指令 的 组 合 情 
况 各 不 相同 。 各 类 指令 在 M1 和 M2 上 运行 时 所 需 的 平均 时 钟 周期 数 和 在 三 类 编译 器 生成 
的 程序 中 所 占 的 百分比 如 表 1.4 所 示 。 


表 1.4 MI 和 M2 的 CPI 以 及 三 个 程序 的 指令 频 度 
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指令 类 M1 的 CPI M2 的 CPI C1 的 程序 C2 的 程序 C3 的 程序 
A 2 | 30% 30% 50% 
B 3 2 50% 20% 30% 
人 4 1 20% 50% 20% 
请 回答 下 列 问题 ; 
(1) 如 果 M1 和 M2 都 使 用 C1 编译 器 , 则 M1 的 生产 厂商 可 以 声称 其 性 能 是 M2 的 多 


少 售 ? 
(2) 如 果 MI 和 M2 都 使 用 C2 编译 器 , 则 M2 的 生产 厂商 可 以 声称 其 性 能 是 M1 的 多 
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少 倍 ? 

(3) 如 果 你 购买 了 M1 ,那么 你 会 选择 哪 种 编译 器 ? 如 果 你 购买 了 M2 ,你 又 会 选择 哪 种 
编译 器 ? 

(4) 如 果 其 他 所 有 指标 (包括 价格 ) 都 相同 ,你 会 买 哪 台 机 器 ? 

【分 析 解 答 】 

(1) 在 M1 和 M2 上 都 用 Cl 编译 器 , 则 ML 上 的 CPI 为 2X30% 十 3X50% 十 4X 
20%==2.9, M2 上 的 CPI 为 1X30% 十 2X50% 十 1.5X20% 二 1.6;MI1 的 时 钟 频率 为 
800MHz, M2 的 时 钟 频率 为 400MHz, 所 以 ,M1 上 一 条 指令 的 平均 执行 时 间 为 2. 9 X1000/ 
800=2.9X1.25 一 3.625ns,M2 上 一 条 指令 的 平均 执行 时 间 为 1. 6 X1000/400=1. 6X 
2.5 二 4ns;MI1 的 性 能 和 M2 的 性 能 之 比 为 4/3.625s:1.1, 所 以 ,Ml 的 生产 商 可 以 声称 M1 
的 性 能 大 约 是 M2 的 1.1 售 。 

(2) 假定 在 MI 和 M2 上 都 用 C2 编译 器 , 则 M1 上 的 CPI 为 2X30% 十 3X20% 十 4X 
50%==3,2, M2 上 的 CPI 为 1X30% 十 2X20% 十 1. 5X50%==1.45; M1 的 时 钟 频率 为 
800MHz,M2 的 时 钟 频率 为 400MHz, 所 以 M1 上 一 条 指令 的 平均 执行 时 间 为 3. 2X 1000/ 
800 二 3.2X1.25 二 4ns, M2 上 一 条 指令 的 平均 执行 时 间 为 1. 45X1000/400==1.45X2. 5= 
3.625ns;M2 的 性 能 和 M1 的 性 能 之 比 为 4/3. 625s:1.1, 所 以 ,M2 的 生产 商 可 以 声称 M2 
的 性 能 大 约 是 M1 的 1.1 售 。 

(3) 由 上 述 分 析 可 知 : Cl 编译 器 在 MI 上 的 性 能 比 M2 好 ,因此 ,如 果 购 买 了 M1, 则 编 
译 器 应 选择 C1; 同 理 ,如 果 购 买 了 M2, 则 编译 器 应 选择 C2 。 

(4) 从 上 述 (1) 和 (2) 分 析 结果 来 看 ,用 生产 商 各 自 的 编译 器 无 法 衡量 Ml 和 M2 的 好 
坏 , 所 以 借助 第 三 方 提供 的 编译 器 C3 来 考察 更 客观 。 假 定 在 Ml 和 M2 上 都 用 C3 编译 器 ， 
则 M1 上 的 CPI 为 2X50% 十 3X30% 十 4X20%==2.7,M2 上 的 CPI 为 1X50% 十 2X 
30% 十 1. 5X20%==1.4;MI1 的 时 钟 频 率 为 800MHz,M2 的 时 钟 频率 为 400MHz, 所 以 M1 
上 一 条 指令 的 平均 执行 时 间 为 2.7X1000/800=2.7X1.25=3.375ns,M2 上 一 条 指令 的 平 
均 执行 时 间 为 1.4X1000/400=1.4X2.5=3. 5ns; M1 的 性 能 和 M2 的 性 能 之 比 约 为 3. 5/ 
3.375S1.04, 用 第 三 方 编译 器 C3 说 明 M1 的 性 能 大 约 是 M2 的 1. 04 倍 ,因此 可 选择 购 
买 Ml。 

6. 若 机 器 M1 和 M2 具有 相同 的 指令 集 ,其 时 钟 频率 分 别 为 0.8GHz 和 1.6GHz。 在 
指令 集中 有 5 种 不 同类 型 的 指令 A~E。 表 1.5 给 出 了 在 Ml 和 M2 上 每 类 指令 的 平均 时 
钟 周期 数 CPI。 





表 1.5 在 M1 和 M2 上 每 类 指令 的 平均 时 钟 周 期 数 CPI 























机 器 A B C D E 
MI1 1 2 2 3 4 
M2 2 和 4 5 6 
请 回答 下 列 问题 ， 
(1) M1 和 M2 的 峰值 MIPS 各 是 多 少 ? 
(2) 假定 某 程序 P 的 指令 序列 中 ,5 类 指令 具有 完全 相同 的 指令 条 数 , 则 程序 P 在 Ml 
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和 M2 上 运行 时 , 哪 台 机 器 更 快 ? 快 多 少 ? 在 ML 和 M2 上 执行 程序 P 时 的 平均 时 钟 周期 
数 CPI 各 是 多 少 ? 章 
【分 析 解 答 】 





(1) 计算 峰值 MIPS 时 应 该 选择 CPI 最 少 的 指令 , 故 在 ML 上 可 以 选择 一 段 全 部 由 A 
类 指令 组 成 的 程序 ,其 峰值 MIPS 为 800/1 王 800MIPS, 在 M2 上 可 以 选择 一 段 全 部 由 A 类 
和 B 类 指令 组 成 的 程序 ,其 峰值 MIPS 为 1600/2==800MIPS。 

(2) 对 于 程序 P, 每 类 指令 的 条 数 均 占 1/5, 故 Ml 的 CPI 为 CPL ==(1 十 2 十 2 十 3 十 4)/ 
5 一 2.4,M2 的 CPI 为 CPls 二 (2 十 2 十 4 十 5 十 6)/5 二 3.8。 当 然 ,不 能 根据 以 上 结果 说 明 程序 
P 在 M1 上 运行 更 快 ,因为 M1 和 M2 的 时 钟 频率 不 同 。 

假设 程序 P 的 指令 条 数 为 N, 则 了 在 M1 上 的 执行 时 间 为 2.4XNX1/0.8=3.0N( 单 
位 为 ns); 在 M2 上 的 执行 时 间 为 3.8XNX1/1.6=2.375N( 单 位 为 ns), 所 以 ,M2 执行 P 
的 速度 更 快 ,每 条 指令 平均 快 0. 625ns。 

从 该 题 可 以 看 出 ,虽然 程序 P 在 M1 中 每 条 指令 执行 所 花 的 时 钟 周期 数 少 ,但 是 ,因为 
M2 的 时 钟 频率 更 快 ,因而 时 钟 周期 更 短 , 使 得 每 条 指令 的 平均 执行 时 间 更 短 。 

7. 假设 同一 套 指令 集 用 不 同 的 方法 设计 了 两 种 机 器 M1 和 M2。 机 器 M1 的 时 钟 周期 
为 0. 8ns, 机 器 M2 的 时 钟 周期 为 1. 2ns。 某 个 程序 P 在 机 器 MI 上 运行 时 的 CPI 为 4, 在 
M2 上 的 CPI 为 2。 对 于 程序 P 来 说 , 哪 台 机 器 的 执行 速度 更 快 ? 快 多 少 ? 

【分 析 解 答 】 

因为 MI 和 M2 实现 的 是 同一 套 指令 集 ,所 以 程序 P 在 机 器 M1 和 M2 上 的 指令 条 数 相 
同 , 假 定 是 NN 条 , 则 P 在 Ml 上 的 执行 时 间 为 4X0.8XN=3.2N( 单 位 为 ns);P 在 M2 上 的 
执行 时 间 为 2X1.2XN=2.4N( 单 位 为 ns)。 由 此 可 知 ,对 于 程序 P 来 说 ,M2 的 执行 速度 
更 快 ,平均 每 条 指令 快 0. 8ns。 

8. 假设 某 机 器 M 的 时 钟 频率 为 2GHz, 用 户 程序 P 在 M 上 的 指令 条 数 为 1X10" ,其 
CPI 为 1.5, 则 P 了 在 M 上 的 执行 时 间 是 多 少 ? 若 在 机 器 M 上 从 程序 P 开始 启动 到 执行 结束 
所 需 的 时 间 是 2s, 则 程序 P 的 用 户 CPU 时 间 占 用 的 百分比 是 多 少 ? 

【分 析 解 答 】 

程序 P 在 机 器 M 上 执行 所 需 时 钟 周期 数 为 1 X10 X1.5==1.5X10 ,所 需 时 间 为 1. 5X 
10/(2X10’) 二 0.75s, 程 序 P 的 用 户 CPU 时 间 在 2s 内 占用 的 百分比 是 0.75/2X100%= 
37.5%。 

9. 假定 某 编 译 器 对 某 段 高 级 语言 程序 编译 生成 两 种 不 同 的 指令 序列 S1 和 S2, 在 时 钟 
频率 为 1GHz 的 机 器 M 上 运行 ,目标 指令 序列 中 用 到 的 指令 类 型 有 A、B、C 和 D 四 类 。 四 
类 指令 在 M 上 的 CPI 分 别 为 1.2、3、4, 两 个 指令 序列 SI 和 S2 所 用 的 各 类 指令 条 数 如 
表 1.6 所 示 。 


表 1.6 两 个 指令 序列 所 用 的 各 类 指令 条 数 


指令 序列 A B C D 
Sl 5 2 2 1 








S2 1 1 1 5 
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请 问 S1 和 S2 各 有 和 多少 条 指令 ?CPI 各 为 多 少 ” 所 含 的 时 钟 周期 数 各 为 多 少 ? 执行 时 


间 各 为 多 少 ? 

【分 析 解 答 】 

序列 Sl 的 指令 条 数 为 5 十 2 
所 含 的 时 钟 周期 数 为 1. 9X10=1 

序列 S2 的 指令 条 数 为 1 十 11 
所 含 的 时 钟 周 期 数 为 3. 25 X 8 二 2 


9, 故 执行 时 间 为 19/(1X109)s 一 19ns。 





HF-2 十 1 二 10,CPI 为 (5X1 十 2X2 十 2X3 十 1X4)/10=1.9， 





1 十 5 二 8,CPI 为 (1X1 十 1X2 十 1 X31 
6, 故 执行 时 间 为 26/(1X10?)s 王 26ns。 


HF5X4)/8=3. 25， 


10. 假定 机 器 M 的 时 钟 频率 为 200MHz, 某 程序 P 在 机 器 M 上 的 执行 时 间 为 12s。 对 
P 优 化 时 ,将 其 所 有 的 乘 4 指令 都 换 成 了 一 条 左 移 两 位 的 指令 ,得 到 优化 后 的 程序 P'。 若 在 
M 上 乘法 指令 的 CPI 为 102, 左 移 指令 的 CPI 为 2,P 的 执行 时 间 是 P' 执 行 时 间 的 1. 2 倍 ， 
则 P 了 中 有 和 多少 条 乘法 指令 被 蔡 换 成 了 左 移 指令 执行 ? 


【分 析 解 答 】 


P' 的 执行 时 间 为 10s,P 比 P' 多 用 了 2s, 即 多 200X10 X2= 二 4X10 个 时 钟 周期 ,每 条 乘 
法 指令 比 左 移 指令 多 100 个 时 钟 周期 ,因为 4X108/100=4X10:, 即 有 400 万 条 乘法 指令 被 


替换 为 左 移 指令 执行 。 





数据 的 机 器 级 表示 


2.1 教学 目标 和 内 容 安排 


主要 教学 目标 : 使 学 生 掌握 计算 机 内 部 各 种 数据 的 机 器 级 表示 ,并 能 将 这 些 知 识 熟练 
运用 到 高 级 语言 和 机 器 级 语言 的 编程 和 调试 工作 中 。 

基本 学 习 要 求 : 

(1) 了 解 真 值 和 机 器 数 的 含义 。 

(2) 了 解 无 符号 整数 的 含义 、 用 途 和 表示 。 

(3) 了 解 带 符号 整数 的 表示 方法 。 

(4) 理解 为 什么 现代 计算 机 都 用 补 码 表示 带 符号 整数 。 

(5) 掌握 在 真 值 和 各 种 编码 表示 数 之 间 进 行 转换 的 方法 。 

(6) 了 解 浮 点 数 表 示 格式 及 其 与 表示 精度 和 表示 范围 之 间 的 关系 。 

(7) 掌握 规格 化 浮 点 数 的 概念 和 浮 点 数 规格 化 方法 。 

(8) 掌握 IEEE 754 标准 ,并 能 在 真 值 与 单 精度 格式 浮 点 数 之 间 进 行 转换 。 

(9) 能 运用 数据 表示 知识 解释 和 解决 高 级 语言 编程 中 数据 表示 和 转换 问题 。 

(10) 掌握 常用 的 十 进 制 数 的 二 进 制 编码 方法 ,如 8421 码 。 

(11) 了 解 逻辑 数据 \ 西 文字 符 和 汉字 字符 的 常用 表示 方法 ,如 ASCIT 码 .GB2312。 

(12) 了 解 常用 数据 长 度 单位 的 含义 ,如 b.B.KB、MB.GB、TB 等。 

(13) 了 解 大 端 和 小 端 排列 方式 ,以 及 数据 的 对 齐 存储 方式 。 

(14) 掌握 奇偶 校 验 和 海 明 校 验 的 基本 原理 。 

(15) 掌握 CRC 码 校 验 位 的 计算 和 检 错 方法 。 


本 章 内 容 比 较 容易 ,学 生 也 比较 熟悉 ,对 于 信息 的 二 进 制 表示 、 进 位 记 数 制 等 简单 内 容 ， 
完全 可 以 让 学 生 自 学 。 如 果 课 时 不 充裕 ,对 于 十 进 制 数 的 表示 和 汉字 字符 编码 部 分 ,也 可 以 
只 简单 介绍 其 概要 内 容 ,细节 部 分 留 给 学 生 课 后 阅读 。 关 于 高 级 语言 中 的 各 种 数据 类 型 与 
机 器 级 数据 表示 之 间 的 关系 ,应 该 要 求学 生 掌握 ,这 对 于 提高 学 生 程序 设计 和 调试 能 力 起 到 
很 大 的 作用 。 其 实 , 这 部 分 内 容 很 简单 ,只 要 在 教学 过 程 中 提醒 学 生 关注 并 进行 一 些 编程 练 
习 就 能 达到 目的 ,而 且 程序 设计 课程 中 大 多 也 会 介绍 这 部 分 内 容 。 

对 于 本 章 内 容 ,教学 过 程 中 普遍 存在 的 问题 是 ,学 生 缺 乏 将 机 器 级 数据 表示 和 程序 设计 
及 程序 调试 工作 相互 关联 的 意识 。 许 多 学 生 也 许 对 机 器 级 数据 表示 的 基本 原理 和 概念 很 了 
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解 ,但 在 程序 设计 和 调试 工作 中 ,往往 不 会 运用 所 学 知识 解决 实际 问题 ,不 会 把 高 级 语言 
的 类 型 定义 ,数值 范围 数据 类 型 转换 等 问题 和 本 课程 所 学 的 知识 联系 起 来 ,因而 ,所 学 知识 
没有 起 到 真正 的 作用 。 

为 了 增强 学 生 对 机 器 级 数据 表示 的 认识 ,可 以 让 学 生 亲 自 编写 相关 的 程序 ,通过 程序 的 
执行 结果 来 理解 本 章 所 学 的 知识 。 与 本 章 内 容 相关 的 编程 练习 可 以 有 很 多 ,以 下 给 出 一 些 
示例 。 中 验证 主教 材 中 表 2. 2 给 出 的 关系 表达 式 的 结果 ,并 编程 得 出 主教 材 第 2 章 习 题 8 
表 2.11 中 的 结果 ; @ 确 定 float 型 变量 和 double 型 变量 的 精度 ;检查 一 些 特殊 表达 式 的 运 
行 结 果 , 如 一 个 非 零 整数 除 以 0, 一 个 非 零 实 数 除 以 0,0 除 以 0, 负数 开平 方 ,等 等 , @ 检 查 
机 器 是 大 端 还 是 小 端 方式 数据 ; @ 检 查 数 据 是 对 齐 存放 还 是 不 对 齐 存放 。 


2.2 主要 内 容 提要 


1. 数据 的 表示 

数据 主要 有 数值 数据 与 非 数值 数据 两 类 。 

数值 数据 指 在 数 轴 上 有 对 应 的 点 .能 比较 大 小 的 数 , 在 计算 机 中 有 二 进 制 数 和 十 进 制 数 
两 种 表示 形式 。 二 进 制 表示 有 无 符号 整数 , 带 符号 整数 和 浮 点 数 三 类 。 无 符号 整数 也 称 无 
符号 数 ,用 来 表示 指针 、 地 址 等 正 整 数 ; 带 符号 整数 一 般 用 补 码 表示 ; 浮 点 数 用 来 表示 实数 ， 
现代 计算 机 中 多 采用 IEEE 754 标准 。 十 进 制 表示 的 主要 是 整数 ,需要 用 二 进 制 对 其 进行 
编码 ,因此 也 称 为 BCD(Binary Coded Decimal) 码 ,最 常用 的 BCD 码 是 8421 码 。 

非 数 值 数 据 指 在 数 轴 上 没有 对 应 的 点 的 数据 ,主要 包括 逻辑 值 . 西 文 字符 和 汉字 字符 
等 。 敢 辑 值 只 有 两 个 状态 取 值 , 按 位 进行 运算 ; 西 文字 符 多 采用 7 位 ASCII 码 表示 ;汉字 字 
符 有 输入 码 、 内 码 和 字模 码 ,汉字 内 码 大 多 占 两 个 字 节 。 

2. 数据 的 宽度 

通常 以 字 节 (B) 为 基本 单位 表示 ,数据 长 度 单位 (如 MB、GB、TB 等 ) 在 表示 数据 容量 和 
带宽 等 不 同 对 象 时 所 代表 的 大 小 不 同 。 

3. 数据 的 排列 

数据 有 大 端 和 小 端 两 种 排列 方式 。 大 端 方式 以 MSB 所 在 地 址 为 数据 的 地 址 , 即 给 定 
地 址 处 存放 的 是 数据 最 高 有 效 字 节 ;小 端 方 式 以 LSB 所 在 地 址 为 数据 的 地 址 , 即 给 定 地 址 
处 存放 的 是 数据 最 低 有 效 字 节 。 

4. 数据 校 验方 式 

常用 的 数据 校 验 方式 有 三 种 : 奇偶 校 验 、 海 明 校 验 和 循环 宛 余 码 校 验 。 

奇偶 校 验方 式 根据 数据 的 奇偶 性 变化 来 检 错 ,只 能 检测 奇数 个 错 ; 海 明 校 验 采用 分 组 奇 
偶 校 验 ,SEC 只 能 纠正 一 位 错 , SEC-DED 可 纠正 一 位 错 并 检测 两 位 错 ; 循环 宛 余 码 校 验 
(CRC) 通 过 某 种 数学 运算 在 数据 和 校 验 位 之 间 建立 约定 关系 , 它 可 以 对 较 长 数据 块 进行 校 
验 而 不 增加 校 验 位 开销 ,因此 ,主要 用 于 对 大 批量 数据 的 存储 或 传输 校 验 。 


数据 的 机 器 级 表示 


2.3 ”基本 术语 解释 


机 器 数 (computer word) 

通常 将 数值 数据 在 计算 机 内 部 编码 表示 的 数 称 为 机 器 数 。 机 器 数 中 只 有 0 和 1 两 种 
符号 。 

真 值 Cnatural number) 

机 器 数 真正 的 值 ( 即 原来 带 有 正 负 号 的 数 ) 称 为 机 器 数 的 真 值 。 

数值 数据 (numerical data) 

指 有 确定 的 值 的 数据 ,在 数 轴 上 能 找到 其 对 应 的 点 ,可 以 比较 其 大 小 。 确 定 一 个 数值 数 
据 的 值 有 三 个 要 素 , 进位 记 数 制定 / 浮 点 表示 和 数 的 编码 表示 。 也 就 是 说 ,给 定 一 个 数字 
序列 ,如 果 不 说 明 这 个 数字 序列 是 几 进 制 数 ,小 数 点 的 位 置 在 哪里 ,采用 什么 编码 方式 ,那么 
这 个 数字 序列 的 值 是 无 法 确定 的 。 

非 数 值 数据 (non-numerical data) 

指 在 数 轴 上 没有 确定 的 值 的 数据 , 像 迟 辑 数据 , 西 文字 符 ,汉字 字符 等 都 是 非 数值 数据 。 

基数 (radix,base) 

进位 记 数 制 的 “底数 ”或 “ 基 ”。 例 如 ,二 进 制 数 的 基数 是 2, 十 进 制 数 的 基数 为 10, 十 六 
进 制 的 基数 为 16。 

无 符号 整数 (unsigned integer) 

当 一 个 编码 的 所 有 二 进位 都 用 来 表示 数值 时 ,该 编码 表示 的 就 是 无 符号 整数 ,也 称 为 无 
符号 数 ,可 以 看 成 是 正 整数 。 常 用 于 表示 指针 和 地 址 等 。 

带 符号 整数 (signed integer) 

在 计算 机 内 部 对 正 . 负 号 进行 编码 的 整数 ,也 称 为 有 符号 整数 。 

定点 数 (fixed-point number) 

定点 数 是 计算 机 中 小 数 点 固定 在 最 左边 或 最 右边 的 数 , 有 定点 整数 和 定点 小 数 两 种 。 
定点 整数 的 小 数 点 总 是 约定 在 数 的 最 右边 ,主要 用 来 表示 现实 世界 中 的 整数 和 浮 点 数 中 的 
指数 。 定 点 小 数 的 小 数 点 总 是 约定 在 数 的 最 左边 ,主要 用 来 表示 浮 点 数 中 的 尾数 。 

定点 数 的 编码 方式 有 原 码 \ 反 码 、 补 码 和 移 码 ; 浮 点 数 的 尾数 一 般 用 原 码 小 数 来 表示 ; 浮 
点 数 的 指数 一 般 用 移 码 来 表示 ;而 反 码 很 少 被 使 用 ,只 用 在 某 些 特殊 场合 。 

浮 点 数 (floating-point number) 

浮 点 数 是 计算 机 中 可 以 指定 小 数 点 在 不 同位 置 的 数 。 任 意 一 个 浮 点 数 下 可 写成 f= 
MX2 的 形式 。 这样 ,一 个 浮 点 数 就 可 用 两 个 定点 数 表 示 , M 称 为 浮 点 数 的 尾数 
(mantissa，significand) ,用 一 个 定点 小 数 来 表示 ;E 称 为 浮 点 数 的 指数 或 阶 码 (exponent)， 
用 一 个 定点 整数 来 表示 。 

原 码 (signed magnitude) 

由 符号 位 直接 跟 数值 位 构成 ,也 称 “ 符 号 -数值 表示 法 。 它 的 编码 规则 是 : 正 号 “十 ”用 
符号 位 0 表示 , 负 号 “一 ” 用 符号 位 1 表示 ,数值 部 分 不 变 。 这 种 编码 比较 简单 ,但 计算 机 处 
理 不 方便 ,20 世纪 50 年 代 以 后 ,就 不 用 它 来 表示 整数 。 现 代 计 算 机 中 ,一 般 用 它 来 表示 浮 
点 数 的 尾数 ,如 IEEE 754 标准 。 


击溃 
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反 码 (one’s complement) 

一 种 对 定点 整数 或 定点 小 数 进行 二 进 制 编码 的 编码 方案 。 由 于 计算 机 处 理 反 码 没有 补 
码 方便 , 反 码 已 很 少 使 用 了 。 

补 码 (two’s complement) 

补 码 编码 规则 是 : 正 号 “十 ”用 符号 位 0 表示, 负 号 “一 ”用 符号 位 1 表示 , 正 数 的 数值 部 
分 不 变 ,负数 的 数值 部 分 是 “各 位 取 反 ,未 位 加 1”。 这 种 编码 较 原 码 复 杂 , 但 由 于 它 是 一 种 
模 运算 系统 ,计算 机 处 理 很 方便 。 常 用 补 码 表示 带 符号 整数 。 

变形 补 码 (four’s complement) 

变形 补 码 是 一 种 双 符号 位 补 码 , 又 称 为 “ 模 4- 补 码 ”。 双 符号 位 可 以 用 来 检测 定点 整数 
是 否 发 生 溢出 , 左 符号 位 为 真正 的 符号 位 , 右 符 号 位 用 来 判别 是 否 溢出 。 采 用 “变形 补 码 ” 进 
行 溢出 检测 时 的 判断 规则 为 * 当 结果 的 两 个 符号 位 不 同时 发 生 溢出 ”。 双 符号 位 通常 用 于 保 
存 运算 过 程 中 进 到 高 位 的 数值 部 分 。 

移 码 (excess notation, biased notation) 

移 码 编码 规则 是 : 将 真 值 加 上 一 个 偏 置 常 数 (bias)。 因 为 在 浮 点 数 的 加 减 运算 中 要 进 
行 对 阶 操作 ,需要 比较 两 个 阶 的 大 小 。 用 移 码 表示 阶 码 后 ,使 得 所 有 数 的 阶 码 都 相当 于 一 个 
正 整 数 ,比较 大 小 时 ,就 只 要 按 高 位 到 低位 顺序 比较 就 行 了 ,因而 , 移 码 主要 用 来 表示 浮 点 数 
的 阶 码 ,可 以 简化 阶 码 的 比较 过 程 。 

单 精度 浮 点 数 (single precision floating point) 

指 IEEE 754 标准 规定 的 32 位 浮 点 数 格式 表示 的 浮 点 数 。 阶 码 用 8 位 移 码 表示 , 偏 置 
常数 为 127, 尾 数 用 原 码 表示 ,规格 化 浮 点 数 的 最 高 位 1 隐 含 不 表示 , 显 式 表示 的 尾数 有 
23 位 ,所 以 一 共有 24 位 尾数 。 

双 精 度 浮 点 数 (double precision floating point) 

指 IEEE 754 标准 规定 的 64 位 浮 点 数 格式 表示 的 浮 点 数 。 阶 码 用 11 位 移 码 表示 , 偏 置 
常数 为 1023, 尾 数 用 原 码 表示 ,规格 化 浮 点 数 的 最 高 位 1 隐 含 不 表示 , 显 式 表示 的 尾数 有 
52 位 ,所 以 一 共有 53 位 尾数 。 

机 器 零 (machine “0”) 

用 一 种 专门 的 位 序列 表示 “机 器 0”。 例 如 ,IEEE 754 单 精度 浮 点 数 中 ,用 0000 0000H 
表示 十 0, 用 8000 0000H 表示 一 0。 当 运算 结果 出 现 阶 码 过 小 时 ,计算 机 将 该 数 近似 表示 为 
“机 器 0”。 

BCD 码 

十 进 制 数 用 二 进 制 编码 的 形式 表示 称 为 BCD(Binary Coded Decimal) 码 。 

逻辑 数据 (logic data) 

逻辑 数据 用 来 表示 命题 的 * 真 > 和 * 假 >, 分 别 用 1 和 0 来 表示 。 进 行 逻辑 运算 时 , 按 位 
进行 。 

ASCII 码 

目前 计算 机 中 使 用 最 广泛 的 西 文字 符 集 及 其 编码 , 即 美国 标准 信息 交换 码 (American 
Standard Code for Information Interchange) ,简称 ASCII 码 。 

汉字 输入 码 (Chinese character input code) 

对 每 个 汉字 用 一 个 标准 键盘 上 按键 的 组 合 来 表示 的 编码 方式 。 一 般 分 为 数字 编码 (如 


发 据 的 机 器 级 表示 


区 位 码 ) .字音 编码 (如 微软 拼音 、 全 拼 ) .字形 编码 (如 五 笔 字 型 ) 和 形 音 编 码 。 

汉字 内 码 (Chinese character code) 

用 于 汉字 在 计算 机 内 部 进行 存储 查找 ,传输 和 处 理 而 采用 的 编码 方式 ,通常 用 2 个 字 
节 表 示 一 个 汉字 内 码 。 

机 器 字 长 (machine word length) 

一 个 二 进 制 位 (bit, 比特) 是 计算 机 内 部 信息 表示 的 最 小 单位 。 而 机 器 字 长 指 的 是 特定 
计算 机 中 CPU 用 于 定点 整数 运算 的 数据 通路 的 宽度 ,通常 也 就 是 CPU 内 定点 数 运算 器 和 
通用 寄存 器 的 位 数 。 

编 址 单位 (addressing unit) 

对 主 存单 元 编号 时 ,具有 相同 编号 的 二 进位 数 , 主 存单 元 的 编号 称 为 地 址 。 通 常 的 编 址 
单位 为 8, 即 字 节 。 按 字 节 编 址 时 , 编 址 单位 为 字 节 ; 按 字 编 址 时 , 编 址 单位 为 字 。 

字 地 址 (word address) 

按 字 节 编 址 时 ,一 个 字 可 能 占用 几 个 内 存单 元 , 字 地 址 就 是 这 几 个 连续 内 存单 元 地 址 中 
的 最 小 值 。 

最 高 有 效 位 (Most Significant Bit, MSB) 

一 个 二 进 制 数 中 的 最 高 位 ,例如 二 进 制 数 1000 中 的 1 。 

最 低 有 效 位 (Least Significant Bit,LSB) 

一 个 二 进 制 数 中 的 最 低位 ,例如 二 进 制 数 1110 中 的 0。 

高 有 效 字 节 (Most Significant Byte,MSB) 

一 个 二 进 制 数 中 的 最 高 字 节 ,例如 二 进 制 数 1111 1111 0000 0000 1111 0000 中 的 1111 
过 1。 

最 低 有 效 字 节 (Least Significant Byte,LSB) 

一 个 二 进 制 数 中 的 最 低 字 节 , 例 如 二 进 制 数 1111 1111 0000 0000 1111 0000 中 的 1111 
0000。 

大 端 方式 (big endian) 

采用 字 节 编 址 方式 时 ,一 个 多 字 节 数据 (如 int,float 等 类 型 数据 ) 将 占用 多 个 主 存单 
元 。 大 端 方式 下 ,将 数据 字 的 最 低 有 效 字 节 LSB 存放 在 大 地 址 单元 中 , 即 字 地 址 是 MSB 所 
在 单元 的 地 址 。 

小 端 方式 (little endian) 

采用 字 节 编 址 方式 时 ,一 个 多 字 节 数据 (如 int、float 等 类 型 数据 ) 将 占用 多 个 主 存单 
元 。 小 端 方式 下 ,将 数据 字 的 最 低 有 效 字 节 LSB 存放 在 小 地 址 单元 中 , 即 字 地 址 是 LSB 所 
在 单元 的 地 址 。 

边界 对 齐 (boundary alignment) 

要 求 数据 的 地 址 是 相应 的 边界 地 址 。 例 如 , 按 字 节 编 址 时 ,4 字 节 长 数据 的 地 址 应 该 是 
4 的 倍数 , 即 最 末 两 位 总 是 00,2 字 节 长 数据 的 地 址 总 是 2 的 倍数 。 

检 错 和 纠 错 (error detect and correct) 

数据 在 计算 机 内 部 被 处 理 的 过 程 中 会 因为 硬件 故障 而 产生 差错 。 因 此 需要 采用 数据 校 
验方 法 来 发 现 是 否 有 错 , 即 检 错 。 有 些 数据 校 验方 法 可 以 准确 发 现 错误 的 位 置 ,从 而 可 以 将 
二 进 制 值 取 反 , 即 纠 错 。 
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码 距 (code distance) 

两 个 码 字 中 具有 不 同 代码 的 位 数 叫 码 字 间 的 “距离 ”。 在 一 种 编码 方式 下 所 有 可 能 出 现 
的 码 字 中 ,任意 两 两 进行 比较 得 到 一 组 距离 ,其 中 的 最 小 值 称 为 这 种 编码 方式 的 码 距 。 例 
如 ,8421 码 的 码 距 为 1。 

奇偶 校 验 (parity check) 

通过 在 原 二 进 制 数据 中 增加 一 个 奇 校 验 位 ( 偶 校 验 位 ) ,用 它 使 这 组 代码 中 1 的 个 数 为 
奇数 (偶数 ) ,最 后 在 该 数据 传输 的 结果 中 检查 1 的 个 数 是 否 保持 为 奇数 (偶数 ), 如 是 , 则 认 
为 正确 或 有 偶数 个 位 置 出 错 , 否 则 ,认为 有 奇数 个 位 置 出 错 。 

海 明 码 (Hamming codes) 

主要 用 于 存储 器 中 的 数据 校 验 ,将 数据 按 某 种 规律 分 成 若干 组 ,对 每 组 进行 相应 的 奇偶 
检测 。 最 终 比 较 时 , 按 位 进行 异 或 操作 ,根据 异 或 操作 结果 ,确定 在 哪 一 位 发 生 了 差错 。 

循环 宛 余 校 验 (Cyclie Redundancy Check,CRC) 

常用 于 外 存储 器 或 数据 通信 中 的 数据 校 验 , 检 错 纠 错 能 力 强 。 编 码 时 通过 某 种 数学 运 
算 根据 原 数据 生成 校 验 位 ,在 检查 时 对 含 校 验 位 的 数据 进行 相应 的 数学 运算 ,根据 运算 结果 
即 可 完成 检 错 和 纠 错 。 


2.4 常见 问题 解答 


1. 真 值 和 机 器 数 的 关系 是 什么 ? 

答 : 在 计算 机 内 部 用 二 进 制 编码 表示 的 数 称 为 机 器 数 ,而 机 器 数 真 正 的 值 ( 即 原来 带 有 
正 负 号 的 数 ) 称 为 机 器 数 的 真 值 ,所 以 ,它们 之 间 的 关系 就 是 同一 个 数据 的 两 种 不 同 表示 

2. 什么 是 编码 ? 

答 : 编码 是 指 用 少量 简单 的 基本 符号 对 大 量 复杂 多 样 的 信息 进行 一 定 规律 的 组 合 。 基 
本 符号 的 种 类 和 组 合 规则 是 信息 编码 的 两 大 要 素 。 例 如 ,用 10 个 阿拉 伯 数 字 表 示 数 值 , 电 
报 码 中 用 4 位 十 进 制 数字 表示 汉字 ,等 等 ,都 是 编码 的 典型 例子 。 计 算 机 内 部 处 理 的 所 有 信 
息 都 是 “数字 化 编码 ”了 的 信息 。 

3. 什么 是 数字 化 编码 ? 

答 :“ 数 字 化 编码 ”就 是 对 感觉 媒体 信息 (如 数值 文字 .图像 声音 、 视 频 等 信息 ) 进 行 定 
时 采样 ,将 现实 世界 中 的 连续 信息 转换 为 计算 机 中 离散 的 “样本 ”信息 ,然后 对 这 些 离散 的 
“样本 ”信息 进行 二 进 制 编码 。 

4. 计算 机 内 部 为 什么 用 二 进 制 来 编码 所 有 信息 ? 

答 : 主要 有 3 个 方面 的 原因 : 

(1) 二 进 制 系统 只 有 两 个 基本 符号 : 0 和 1。 所 以 , 它 的 基本 符号 少 ,易于 用 稳 态 电路 
实现 。 
(2) 二 进 制 的 编码 . 记 数 .运算 等 规则 简单 。 

(3) 二 进 制 中 的 0 和 ]1 与 逻辑 命题 的 “ 真 ” 和 ”* 假 "的 对 应 关系 简单 ,为 计算 机 中 实现 旭 
辑 运算 和 程序 中 的 逻辑 判断 提供 了 便利 的 条 件 ,特别 是 能 通过 逻辑 门 电路 方便 地 实现 算术 
运算 。 
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5. 计算 机 内 都 用 二 进 制 表示 信息 ,为 什么 还 要 引入 八进制 和 十 六 进 制 ? 

答 : 计算 机 内 部 在 进行 信息 的 存储 、 传 送 和 运算 时 ,都 是 以 二 进 制 形式 来 表示 信息 的 。 
但 在 屏幕 上 或 书本 上 书写 信息 时 ,由 于 二 进 制 信息 位 数 多 ,阅读 .记忆 不 方便 ,而 十 六 进 制 、 
八进制 和 二 进 制 的 对 应 关系 简单 ,又 便于 阅读 .记忆 和 书写 ,所 以 引入 十 六 进 制 或 八进制 ,使 
得 人 们 在 开发 .调试 程序 和 阅读 机 器 内 部 代码 时 ,能 方便 地 用 八进制 或 十 六 进 制 来 等 价 表示 
二 进 制 信息 。 

6. 如 何 表示 一 个 数值 数据 ?计算 机 中 的 数值 数据 都 是 二 进 制 数 吗 ? 

答 : 在 计算 机 内 部 ,数值 数据 的 表示 方法 有 两 大 类 : 

(1) 直接 用 二 进 制 数 表示 。 分 为 无 符号 数 和 有 符号 数 , 有 符号 数 又 分 为 定点 整数 表示 
和 浮 点 数 表 示 。 无 符号 数 用 来 表示 无 符号 整数 (如 地 址 等 信息 ) ;定点 整数 用 来 表示 带 符号 
整数 ; 浮 点 数 用 来 表示 实数 。 

(2) 采用 二 进 制 编码 的 十 进 制 数 ( 即 BCD 码 ) 来 表示 整数 ,BCD 码 的 编码 方案 很 多 ,但 
一 般 都 采用 8421 码 (也 称 为 NBCD 码 ) 来 表示 。 

因此 ,计算 机 中 的 数值 数据 虽然 都 用 二 进 制 来 编码 表示 ,但 不 全 是 二 进 制 数 ,也 有 用 十 
进 制 数 表示 的 。 因 而 有 些 处 理 器 的 指令 类 型 中 ,就 有 对 应 的 二 进 制 加 法 指令 和 十 进 制 加 法 
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7. 为 什么 要 引入 无 符号 数 表示 ? 
答 , 因为 有 些 情况 下 只 要 对 正 整数 进行 运算 , 且 结 果 不 出 现 负 值 ,此 时 ,可 以 用 无 符号 
数 表示 变量 。 例 如 ,在 进行 地 址 或 指针 运算 时 可 使 用 无 符号 数 。 

8. 在 高 级 语言 程序 中 定义 的 unsigned 型 数据 是 怎么 表示 的 ? 

答 : unsigned 型 数据 就 是 无 符号 数 ,直接 用 二 进 制 对 数值 进行 编码 得 到 的 就 是 无 符 
号 数 。 

9. 为 什么 无 符号 数 运算 时 结果 可 能 会 发 生 “ 溢 出 ”? 什么 叫 无 符号 数 的 “ 浇 出 ? 

答 : 计算 机 的 机 器 字 长 总 是 有 限 的 ,因而 机 器 数 的 位 数 有 限 ,使 得 可 表示 的 数 的 个 数 有 
限 。 对 于 位 二 进 制 数 ,只 能 表示 2" 个 不 同 的 数 , 当 运算 结果 超过 ?位 数 时 就 可 能 发 生 
溢出 。 

对 于 无 符号 数 来 说 ,计算 机 运算 过 程 中 一 般 保留 低位 ,舍弃 高 位 。 这 样 ,会 产生 两 种 
结果 : 

(1) 剩 下 的 低 位 数 不 能 正确 表示 运算 结果 。 这 种 情况 下 ,意味 着 运算 的 结果 超出 了 
计算 机 能 表达 的 范围 ,有 效 数值 进 到 了 第 n 十 1 位 ,我 们 称 此 时 发 生 了 “溢出 ”现象 。 例 如 ， 
对 于 4 位 无 符号 数 相 加 运算 , 当 计 算 14 十 3 时 就 发 生 溢出 , 即 1110 十 0011=1 0001 ,结果 中 
第 一 位 1 是 数值 部 分 ,这 个 1 丢弃 后 结果 就 不 对 了 。 

(2) 剩 下 的 低 位 数 能 正确 表达 计算 结果 ,也 即 高 位 的 舍 去 并 不 影响 其 运算 结果 。 例 
如 ,对 于 4 位 无 符号 数 相 减 运算 , 当 计算 14 一 3 时 ,用 14 加 一 3 的 补 码 来 实现 , 即 1110 十 
1101=1 1011, 结 果 中 第 一 位 1 不 是 数值 部 分 ,这 个 1 丢弃 后 的 结果 是 十 进 制 的 11, 因 此 是 
正确 的 。 

“对 一 个 多 于 位 的 数 丢 弃 高 位 而 保留 低 ” 位 数 ” 这 样 一 种 处 理 , 实际 上 等 价 于 “将 这 
个 多 于 nn 位 的 数 去 除 以 2" ,然后 丢 去 商 保留 其 余数 ”的 操作 。 这 种 操作 运算 就 是 “ 模 运 算 ”。 
在 一 个 模 运算 系统 中 ,运算 的 结果 最 终 都 是 丢弃 高 位 而 保留 低位 。 所 以 ,只 要 不 是 “溢出 ” 
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( 即 只 要 真正 的 值 不 会 进 到 第 十 1 位 ) ,结果 就 是 正确 的 。 这 是 模 运算 系统 的 特点 。 

10. 为 什么 现代 计算 机 都 用 补 码 来 表示 整数 ? 

答 : 和 原 码 、 反 码 相 比 , 用 补 码 表示 定点 整数 时 ,有 以 下 4 个 好 处 : 符号 位 可 以 和 数值 
位 一 起 参加 运算 ; @ 补 码 可 以 实现 模 运 算 , 即 可 用 加 法 方便 地 实现 减法 运算 ; @@ 零 的 表示 
唯一 ; @ 可 以 多 表示 一 个 最 小 负数 。 所 以 ,现代 计算 机 中 都 采用 补 码 来 表示 定点 整数 。 

11. n 位 二 进 制 补 码 整数 的 模 是 多 少 ? 数 的 表示 范围 是 多 什么 ? 

答 : n 位 二 进 制 补 码 整 数 的 模 是 2" ,表示 其 运算 结果 只 保留 低位 ,多 于 位 的 高 位 部 
分 取 模 后 要 被 丢弃 掉 , 其 数值 范围 为 一 2" 一 十 2" 一 1。 

12. 在 高 级 语言 编程 时 定义 的 short ,int long 型 数据 是 怎么 表示 的 ? 

答 : int 型 数据 就 是 定点 整数 ,现代 计算 机 一 般 用 补 码 表示 。int 型 数据 的 位 数 与 运行 
平台 和 编译 器 有 关 , 目 前 ,一 般 是 32 位 或 16 位 。long 型 数据 和 short 型 数据 也 都 是 定点 整 
数 ,用 补 码 表示 ,只 是 位 数 不 同 ,分 别 是 长 整 型 和 短 整 型 数 。 

13. 在 C 语言 程序 中 ,关系 表达 式 “ 一 2147483648= 二 2147483648U” 的 结果 为 什么 为 
. 真 "? 

答 , 关系 表达 式 “ 一 2147483648 二 = 二 2147483648U” 的 左边 是 负数 ,右边 是 正 数 ,因此 ， 
左右 两 数 看 似 不 等 ,结果 似乎 应 该 为 “ 假 ”。 但 是 ,在 C 语言 中 ,如 果 在 一 个 表达 式 中 同时 有 
unsigned int( 无 符号 整数 ) 类 型 和 int( 带 符号 整数 ) 类 型 数据 ,那么 ,C 编译 器 会 隐 含 地 将 int 
型 数据 强制 类 型 转换 为 无 符号 整数 ,因此 ,在 上 面 的 关系 表达 式 运 算 中 ,左边 的 带 符号 整数 
一 2147483648 对 应 的 机 器 数 1000 0000 0000 0000 0000 0000 0000 0000 被 解释 成 无 符号 整 
数 ,其 值 为 21 ,和 右边 的 无 符号 整数 2147483648U 的 值 完 全 相同 ,因而 结果 为 “ 真 ”。 

14. 定点 整数 在 数 轴 上 分 布 的 点 之 间 都 是 等 距 的 吗 ? 

答 : 是 的 。 定 点 整数 在 数 轴 上 的 点 总 是 在 整数 值 上 , 即 : […, 一 5, 一 4, 一 3, 一 2, 一 1， 
0,1,2,3,4,5,…"], 相 邻 数据 间隔 总 是 1 。 

15. 为 什么 要 引入 浮 点 数 表示 ? 

答 : 因为 定点 数 不 能 表示 实数 ,而 且 表 数 范围 小 ,所 以 ,要 引入 浮 点 数 表示 。 

16. 为 什么 浮 点 数 的 阶 ( 指 数 ) 要 用 移 码 表示 ? 

答 : 因为 在 浮 点 数 的 加 减 运 算 中 ,要 进行 对 阶 操作 ,需要 比较 两 个 阶 的 大 小 。 移 码 表示 
的 实质 就 是 把 阶 加 上 一 个 偏 置 常数 ,使 得 所 有 数 的 阶 码 都 是 一 个 正 整数 ,比较 大 小 时 ,就 只 
要 按 高 位 到 低位 顺序 比较 就 行 了 ,因而 ,引入 移 码 可 以 简化 阶 的 比较 过 程 。 

17. 浮 点 数 如 何 表示 0? 

答 : 用 一 种 专门 的 位 序列 表示 0, 例 如 ,IEEE 754 单 精度 浮 点 数 中 ,用 0000 0000H 表示 
十 0, 用 8000 0000H 表示 一 0。 当 运算 结果 出 现 阶 码 过 小 时 ,计算 机 将 该 数 近似 表示 为 0, 称 
为 “机 器 0”。 

18. 现代 计算 机 中 采用 什么 标准 来 表示 浮 点 数 ? 

答 : 早期 的 计算 机 各 自 采用 不 同 的 浮 点 数 表示 格式 ,因而 ,在 不 同 计算 机 之 间 进 行 数据 
交换 时 ,就 会 发 生 数据 不 统一 的 问题 。 所 以 ,专门 制定 了 IEEE 754 标准 用 来 规定 计算 机 中 
的 浮 点 数 表示 格式 。 现 代 计算 机 中 都 采用 IEEE 754 标准 来 表示 浮 点 数 。 

19. 为 什么 浮 点 数 要 采用 规格 化 形式 表示 ? 

答 : 为 了 使 浮 点 数 中 能 尽量 多 地 表示 有 效 位 数 ,提高 浮 点 数 运算 的 精度 ,而 且 规 格 化 形 
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式 具 有 唯一 性 。 

20. 如 何 判 断 一 个 浮 点 数 是 否 是 规格 化 数 ? 

只 要 看 转换 为 真 值 后 ,其 尾数 的 第 一 位 是 否 一 定 是 非 零 数 。 因 此 ,对 于 原 码 编码 的 尾数 
来 说 ,只 要 看 尾数 的 数值 部 分 第 一 位 是 否 为 1 就 行 。 

21. 浮 点 数 表示 的 精度 和 数值 范围 取决 于 什么 ? 

答 : 浮 点 数 的 精度 取决 于 尾数 的 位 数 ,而 数值 范围 取决 于 阶 码 的 位 数 。 在 浮 点 数 总 位 
数 不 变 的 情况 下 , 阶 码 位 数 越 多 , 则 尾数 位 数 越 少 。 即 表 数 范围 越 大 , 则 精度 越 差 ( 数 变 稀 
朴 )。 

22. 基数 的 大 小 对 表 数 范围 和 精度 有 什么 影响 ? 

答 : 基数 越 大 , 则 范围 越 大 ,但 精度 变 低 ( 数 变 稀 朴 ) 。 

23. 在 高 级 语言 编程 中 ,float 和 double 型 数据 是 怎么 表示 的 ? 

答 : 现代 计算 机 用 IEEE 754 标准 表示 浮 点 数 ,其 中 32 位 单 精度 浮 点 数 就 是 float 型 ， 
64 位 双 精 度 浮 点 数 就 是 double 型 。 

24. 在 高 级 语言 编程 中 ,long double 型 数据 是 怎么 表示 的 ? 

答 : long double 型 数据 的 长 度 和 格式 随 编译 器 和 处 理 器 类 型 的 不 同 而 有 所 不 同 。 例 
如 ,Microsoft Visual C++ 6.0 版 本 以 下 的 编译 器 都 不 支持 该 类 型 ,因此 ,用 其 编译 出 来 的 目 
标 代码 中 long double 和 double 一 样 ,都 是 64 位 双 精 度 ;在 IA-32 上 使 用 gcc 编译 器 时 ， 
long double 类 型 数据 采用 Intel x86 FPU 的 80 位 双 精 度 扩展 格式 (1 位 符号 位 s、15 位 阶 码 
e、\1 位 显 式 首位 有 效 位 (explicit leading significand bit)j 和 63 位 尾数 f) 表 示 ; 在 SPARC 和 
PowerPC 处 理 器 上 使 用 gcc 编译 器 时 ,long double 类 型 数据 采用 相应 的 128 位 双 精 度 扩 展 
格式 (1 位 符号 位 s、15 位 阶 码 e 和 112 位 尾数 f, 采 用 隐藏 位 , 故 有 效 位 数 为 113 位 ) 表 示 。 

25. C 语言 程序 中 ,为 什么 关系 表达 式 “123456789 二 二 (int) (float)123456789” 的 结果 
为 “ 假 ”, 而 关系 表达 式 “123456== = (int) (float) 123456” 和 *123456789 二 = (int) (double) 
123456789” 的 结果 都 为 * 真 ”? 

答 : 首先 应 该 明白 ,在 C 语言 中 , float 类 型 对 应 IEEE 754 单 精度 浮 点 数 格式 ,也 即 
float 型 数据 的 有 效 位 数 只 有 24 位 (相当 于 有 7 位 十 进 制 有 效 位 数 );double 类 型 对 应 IEEE 
754 双 精 度 浮 点 数 格式 ,有 效 位 数 有 53 位 (相当 于 有 17 位 十 进 制 有 效 位 数 );int 类 型 为 
32 位 整数 ,其 有 效 位 数 为 31 位 (最 大 数 为 2147483647) 。 

整数 123456789 的 有 效 位 数 为 9 位 ,转换 为 float 型 数据 后 肯定 发 生 了 有 效 位 数 丢 失 ， 
再 转换 为 int 型 数据 时 ,已 经 不 是 123456789 了 ,所 以 ,关系 表达 式 “123456789 二 = (int) 
(float)123456789” 的 结果 为 假 。 

数据 改 为 123456 后 ,有 效 位 数 只 有 6 位 ,转换 为 float 型 数据 后 有 效 位 数 没有 丢失 , 因 
而 数据 没 变 ,再 转换 为 int 型 数据 时 ,还 是 123456, 所 以 ,关系 表达 式 “123456 二 = (int) 
(float)123456” 的 结果 为 真 。 

整数 123456789 的 有 效 位 数 为 9 位 ,转换 为 double 型 数据 后 ,不 会 发 生 有 效 位 数 丢失 ， 
再 转换 为 int 型 数据 时 ,还 是 123456789, 所 以 ,关系 表达 式 *123456789 二 = (int) (double) 
123456789” 的 结果 为 真 。 

26. 位 数 相同 的 定点 数 和 浮 点 数 中 ,可 表示 的 浮 点 数 个 数 比 定点 数 个 数 多 吗 ? 

答 : 不 是 的 。 可 表示 的 数据 个 数 取决 于 编码 所 采用 的 位 数 。 编 码 位 数 一 定 , 则 编码 出 


击溃 
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来 的 数据 个 数 就 是 一 定 的 。 位 编码 最 多 只 能 表示 2" 个 数 ,所 以 ,对 于 相同 位 数 的 定点 数 
和 浮 点 数 来 说 ,可 表示 的 数据 个 数 应 该 一 样 多 。 但 是 ,有 时 由 于 一 个 值 可 能 有 两 个 或 多 个 编 
码 对 应 ,编码 个 数 会 有 少量 差异 。 

27. 如 何 进行 BCD 码 的 编码 ? 

答 : 每 位 十 进 制 数 的 取 值 可 以 是 0、1、2、…、9 这 10 个 数 之 一 ,因此 ,每 一 个 十 进 制 数位 
必须 至 少 由 4 位 二 进 制 位 来 表示 。 而 4 位 二 进 制 位 可 以 组 合成 16 种 状态 ,去 掉 10 种 状态 
后 还 有 6 种 完 余 状态 ,所 以 从 16 种 状态 中 选取 10 种 状态 表示 十 进 制 数位 0 一 9 的 方法 很 
多 ,可 以 产生 多 种 BCD 码 方案 。 大 的 方面 可 分 为 有 权 码 和 无 权 码 两 种 。 

有 权 码 指 表示 每 个 十 进 制 数 位 的 4 个 二 进 制 数位 ( 称 为 基 2 码 ) 都 有 一 个 确定 的 权 。 
8421 码 是 最 常用 的 十 进 制 有 权 码 ;无 权 码 指 表示 每 个 十 进 制 数位 的 4 个 基 2 码 没有 确定 
的 权 。 

28. 逻辑 数据 在 计算 机 中 如 何 表示 ? 如何 运算 ? 

: 逻辑 数据 用 来 表示 命题 的 “ 真 " 和 *“ 假 ”, 分 别 用 1 和 0 来 表示 。 进 行 迎 辑 运算 时 , 按 


.汉字 的 区 位 码 、 国 标 码 和 机 内 码 有 什么 区 别 ? 

答 : GB2312 字符 集 由 94 行 .94 列 组 成 , 行 号 称 为 区 号 , 列 号 称 为 位 号 ,各 占 7 位 , 共 
14 位 ,区 号 在 左 ,位 号 在 右 , 称 为 汉字 的 区 位 码 , 它 指出 了 该 汉字 在 码 表 中 的 位 置 。 

汉字 的 国标 码 是 将 区 号 、 位 号 各 加 上 32( 即 十 六 进 制 的 20H) 后 ,再 在 前 后 各 7 位 前 
加 0。 

汉字 的 内 码 需 两 个 字 节 才能 表示 ,可 以 在 国标 码 的 基础 上 产生 汉字 机 内 码 ,一 般 是 将 国 
标 码 的 两 个 字 节 的 第 一 位 设置 成 1。 

例如 ,已 知 一 个 汉字 的 国标 码 为 343AH, 前 后 两 个 字 节 各 减 32(20H) 得 到 区 位 码 为 
343AH 一 2020H=141AH, 所 以 区 号 为 20(14H) ,位 号 为 26(1AH); 机 内 码 是 将 国标 码 的 两 
个 字 节 的 最 前 面 一 位 变 为 1, 因 此 ,机 内 码 为 BBAH。 

30. MSB(LSB) 表 示 最 高 ( 低 ) 有 效 字 节 还 是 最 高 ( 低 ) 有 效 位 ? 

答 : MSB 的 含义 可 能 是 最 高 有 效 字 节 (Most Significant Byte) ,也 可 能 是 最 高 有 效 位 
(Most Significant Bit) ,具体 表示 哪 一 个 含义 要 看 上 下 文 。 同 样 ,LSB 的 含义 可 能 是 最 低 有 
效 字 节 (Least Significant Byte) ,也 可 能 是 最 低 有 效 位 (Least Significant Bit) 。 

31. 有 了 时 用 “ 字 ” 表 示 数 据 的 宽度 ,一 个 “ 字 ” 到 底 有 多 少 位? 

答 : 除了 用 “比特 (bit)” 和 “ 字 节 (Byte)” 来 表示 一 个 数据 的 宽度 外 ,有 时 也 用 “ 字 
(Word) ”来 表示 数据 宽度 的 单位 。 不 同 的 计算 机 ,其 “ 字 ” 的 长 度 和 组 成 不 完全 相同 ,有 的 由 
2 个 字 节 组 成 ,有 的 由 4 个 、8 个 甚至 16 个 字 节 组 成 。 

32. 一 个 “ 字 ” 的 宽度 就 是 一 个 “机 器 字 长 " 吗 ? 

答 : 不 是 。“ 机 器 字 长 ”是 计算 机 的 一 个 非常 重要 的 指标 。 通 常 称 32 位 机 器 或 64 位 机 
器 ,就 是 指 机 器 的 字 长 是 32 位 或 64 位 。 一 般 情 况 下 ,机 器 字 长 定义 为 CPU 中 一 次 能 够 处 
理 的 二 进 制 整数 的 位 数 ,实际 上 就 是 CPU 中 整数 运算 数据 通路 的 位 数 。 

“ 字 ” 作 为 信息 宽度 的 计量 单位 ,对 于 某 个 系列 机 来 说 ,其 字 宽 总 是 固定 的 。 例 如 ,在 
80x86 系列 中 ,一 个 字 的 宽度 为 16 位 ,因此 ,32 位 是 双 字 ,64 位 是 四 字 。 在 IBM 303X 系列 
中 ,一 个 字 的 宽度 为 32 位 ,所 以 16 位 为 半 字 ,32 位 为 单字 ,64 位 为 双 字 。 


数据 的 机 器 级 表示 


一 个 “ 字 ” 的 宽度 可 以 不 等 于 机 器 字 长 。 例 如 ,在 Intel 微 处 理 器 中 ,从 80386 开始 就 至 
少 都 是 32 位 机 器 了 , 即 机 器 字 长 至 少 为 32 位 ,但 其 字 的 宽度 都 定义 为 16 位 。 

33. 在 表示 存储 容量 和 带宽 时 经 常用 到 KB、MB、GB、TB 等 表示 数据 量 的 单位 ,为 什么 
有 的 时 候 1MB 等 于 105B, 有 的 时 候 又 等 于 22B 呢 ? 

答 ， 当 表 示 二 进 制 存 储 容 量 时 ,度量 单位 用 2 的 震 次 ,例如 , 若 主 存 容量 为 1GB, 则 表示 
主 存 有 2”B。 当 描述 距离 .频率 等 数值 时 ,通常 用 10 的 宕 次 表示 ,因而 在 由 时 钟 频率 计算 得 
到 的 总 线 带宽 或 外 设 数据 传输 率 中 ,度量 单位 表示 的 也 是 10 的 寡 次 。 例 如 , 若 总 线 带宽 为 
1GB/s, 表 示 总 线 每 秒 传输 109B。 为 区 分 这 种 差别 ,通常 用 表示 1024, 用 k 表示 1000, 而 
其 他 前 级 字母 均 为 大 写 ,表示 的 大 小 由 其 上 下 文 决定 。 
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2.5 单项 选择 题 
1. 计算 机 中 的 所 有 信息 都 以 二 进 制 表示 的 原因 是 (  )。 
A. 信息 处 理 方便 B. 运算 速度 快 
C. 节约 元 器 件 D. 物理 器 件 特性 所 致 
2. 引入 八进制 和 十 六 进 制 的 目的 是 (  )。 
A. 节约 元 件 
B. 实现 方便 


C. 可 以 表示 更 大 范围 的 数 
D. 用 于 等 价 地 表示 二 进 制 ,便于 阅读 和 书写 
3， 108 对 应 的 十 六 进 制 形式 是 (  )。 


A. 6CH B. BAH C. 5CH D. 63H 
4. 下 列 数 中 最 小 的 数 为 (。””)。 

A. (1001 0110), B. (63)s C. (1001 0110)ge» D. (2F)' 
5. 下 列 数 中 最 小 的 数 为 (””)。 

A. (1110 0101)。  B. (93)w C. (1001 0010)gep D. (5A)is 
6. 负 零 的 补 码 表示 为 (” )。 

A. 1 00…00 B. 0 00…00 C. 0 11…11 D. 1 11…11 
7. [Xj]# 二 Xo. XI X…X,(m 为 整数 ) , 它 的 模 是 (  )。 

A 2 B: 2 公开 :六 
8. [Xj]# 二 XX。X1 久 2…X,(n 为 整数 ) , 它 的 模 是 (。”)。 

A. 2"t! B. 2" C. 2" 十 1 D. 2 一 1 
9. 下 列 编码 中 ,0 的 表示 形式 是 唯一 的 编码 是 (  )。 

A. 反 码 B. 原 码 C. 补 码 D. 原 码 和 补 码 


10. 在 下 列 有 关 补 码 和 移 码 关 系 的 叙述 中 ,错误 的 是 (。”)。 
A. 相同 位 数 的 补 码 和 移 码 表示 具有 相同 的 表 数 范围 
B. 0 的 补 码 和 移 码 表示 相同 
C. 同一 个 数 的 补 码 和 移 码 表示 ,其 数值 部 分 相同 ,而 符号 相反 
D. 一 般 用 移 码 表示 浮 点 数 的 阶 , 而 补 码 表示 定点 整数 
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11. 计算 机 内 部 的 带 符号 整数 大 多 用 补 码 表 示 ,以 下 是 一 些 关于 补 码 特点 的 叙述 : 
Q@ 零 的 表示 是 唯一 的 。 

@ 符号 位 可 以 和 数值 部 分 一 起 参加 运算 。 

@ 和 其 真 值 的 对 应 关系 简单 直观。 


@ 减法 可 用 加 法 来 实现 。 
以 上 和 叙述 中 ,( ”) 是 补 码 表示 的 特点 。 
A. DO 和 ® B. D 和 ® C. OQ 和 ® D. DO 和 @ 


12. 假定 X= 一 0100 1010B, 在 计算 机 内 部 的 表示 为 1011 0110B, 则 该 数 所 用 的 编码 方 
法 是 (。 ) 
A. 原 码 B. 反 码 C. 补 码 D. 移 码 
13. 设 寄存 器 位 数 为 8 位 ,机 器 数 采 用 补 码 形式 ( 含 一 位 符号 位 ), 则 十 进 制 数 一 26 存放 
在 寄存 器 中 的 内 容 为 (  )。 


A. 26H B. 9BH C. E6H D. 5AH 
14. 一 1029 的 16 位 补 码 用 十 六 进 制 表 示 为 ( )。 
A. 0405H B. 7BFBH C. 8405H D. FBFBH 


15. 考虑 以 下 C 语言 代码 


short si=- 8196; 


unsigned short usi=si; 


执行 上 述 程序 段 后 ,usi 的 值 是 (  )。 

A. 8196 B. 34572 C. 57339 D. 57340 
16. 设 [XX] 生 二 1. XX XXsX,, 当 满足 (  ) 时 ,X>> 一 1/2 成 立 。 

A. Xi 必须 为 1,X,、Xs 、X, 至 少 有 一 个 为 1 

B. Xi 必须 为 1,Xs 、Xs 、X, 任意 

C. Xi 必须 为 0,X, 、Xs 、X4 至 少 有 一 个 为 1 

D，X 必须 为 0,X,、X; 、X4 任意 
17. 设 X= 一 1011, 则 8 位 补 码 LX]# 为 ( ” )。 


A. 1000 0101 B. 1000 1011 C. 1111 1010 D. 1111 1011 
18. 16 位 无 符号 数 所 能 表示 的 数值 范围 是 (。”)。 
A 0"(2% = B. O020 1) 
C02 及 
19. 16 位 补 码 整数 所 能 表示 的 范围 是 ( )。 
| 本 
人 Bm te a 





20. 若 浮 点 数 尾数 用 补 码 表示 , 则 下 列 数 中 为 规格 化 尾数 形式 的 是 (。”)。 

A. 1.110 0000  B. 0.011 1000 C. 0.010 1000 D. 1.000 1000 
21. 若 浮 点 数 尾数 用 原 码 表示 , 则 下 列 数 中 为 规格 化 尾数 形式 的 是 (。”)。 

A. 1.110 0000  B. 0.011 1000 C. 0.01 01000 D. 1.000 1000 
22. 用 于 表示 浮 点 数 阶 码 的 编码 通常 是 (。 )。 


发 据 的 所 器 级 表示 


A. 原 码 B. 补 码 C. 反 码 D. 移 码 
23. 假定 某 数 采用 IEEE 754 单 精度 浮 点 数 格式 表示 为 4510 0000H, 则 该 数 的 值 是 


A. (+1.125)i X2" B. (+1.125) X21 
C. (+0.125)1 X21 D. (+0.125)% X2" 
24. 假定 某 数 采用 IEEE 754 单 精度 浮 点 数 格式 表示 为 C820 0000H, 则 该 数 的 值 是 








A. (一 .01D)mX27 B. (—1.0DwX2* 
C. (—1.25)10 X2’ D, (—1.25)% X2% 
25. 假定 变量 if 的 数据 类 型 分 别 是 int ,float。 已 知 i=12345,f=1.2345e3, 则 在 一 个 
32 位 机 器 中 执行 下 列表 达 式 时 ,结果 为 “ 假 ”的 是 (  )。 
A. i== (int) (float)i B. i==(int) (double)i 
C. {== (float) (int)f D. {== (float) (double)f 
26. IBM 370 的 短 浮 点 数 格式 中 ,总 位 数 为 32 位 ,左边 第 一 位 (bm ) 为 数 符 , 随 后 7 位 
(b1~b1) 为 阶 码 , 用 移 码 表示 , 偏 置 常数 为 64 ,右边 24 位 (如 一 0 ) 为 6 位 十 六 进 制 原 码 小 数 
表示 的 尾数 ,采用 规格 化 形式 。 若 将 十 进 制 数 一 265. 625 用 该 浮 点 数 格式 表示 , 则 应 表示 为 
(  )。( 用 十 六 进 制 形式 表示 ) 
A. C310 9A00H B. 4310 9A00H CC. 8310 9A00H  D. 0310 9A00H 
27. 假定 两 种 浮 点 数 表示 格式 的 位 数 都 是 32 位 ,但 格式 1 的 阶 码 长 ,尾数 短 ,而 格式 2 
的 阶 码 短 ,尾数 长 ,其 他 所 有 规定 都 相同 。 则 它们 可 表示 的 数 的 精度 和 范围 为 (””)。 
A. 两 者 可 表示 的 数 的 范围 和 精度 均 相同 
B. 格式 1 可 表示 的 数 的 范围 更 小 ,但 精度 更 高 
C. 格式 2 可 表示 的 数 的 范围 更 小 ,但 精度 更 高 
D. 格式 1 可 表示 的 数 的 范围 更 大 , 且 精 度 更 高 
28. 在 一 般 的 计算 机 系统 中 , 西 文字 符 编码 普遍 采用 ( ”)。 
A. BCD 码 B. ASCII 码 C. 格雷 码 D. CRC 码 
29. 假定 某 计 算 机 按 字 节 编 址 ,采用 小 端 方式 ,有 一 个 float 型 变量 x 的 地 址 为 FFFF 
C000H,x=1234 5678H, 则 在 内 存单 元 FFFF C001H 中 存放 的 内 容 是 (  )。 
A. 1234H B. 34H C. 56H D. 5678H 
30. 下 面 有 关机 器 字 长 的 叙述 中 ,错误 的 是 (  )。 
A. 机 器 字 长 是 指 CPU 中 定点 运算 数据 通路 宽度 
B. 机 器 字 长 一 般 与 CPU 中 寄存 器 的 位 数 有 关 
C. 机 器 字 长 决定 了 数 的 表示 范围 和 表示 精度 
D. 机 器 字 长 对 计算 机 硬件 的 造价 没有 影响 
31. 下 面 是 关于 计算 机 中 存储 器 容量 单位 的 叙述 ,其 中 错误 的 是 (  )。 
A. 最 小 的 计量 单位 为 位 (b) ,表示 一 位 0 或 1 
B. 最 基本 的 计量 单位 是 字 节 (B) ,一 个 字 节 等 于 8b 
C. 一 台 计 算 机 的 编 址 单位 ,指令 字 长 和 数据 字 长 都 一 样 , 且 是 字 节 的 整数 倍 
D. 主 存 容量 为 1KB, 其 含义 是 主 存 中 能 存放 1024B 的 二 进 制 信息 
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32. 假定 下 列 字符 编码 中 含有 奇偶 校 验 位 ,但 没有 发 生 数据 错误 ,那么 采用 奇 校 验 的 字 
符 编码 是 (  )。 

A. 0101 0011 B. 0110 0110 C. 1011 0000 D. 0011 0101 

33. 假设 需要 传送 的 一 个 数据 块 的 长 度 为 10 位 ,对 每 个 数据 块 采用 CRC 校 验 , 若 约定 
的 生成 多 项 式 为 十 1, 则 对 应 的 CRC 码 的 位 数 是 (  )。 

A. 3 B. 4 Cs D. 14 

34. 假设 某 个 需要 校 验 的 数据 为 0110 0101B, 采 用 CRC 校 验 ,生成 多 项 式 为 x 十 zx 十 1, 则 
对 应 的 校 验 码 是 (。””)。 

A. 0010 B. 0110 C. 1110 D. 1111 

【参考 答案 】 

人 

ii 机 二 7 1 0 A 0, We :1 

2 A DB WC WO Dh DC RB WC 30D 

30. 必 3G 3 

【部 分 题目 的 答案 解析 】 

15. 因为 一 8196 一 一 (8192 十 4) 王 一 10 0000 0000 0100B, 所 以 带 符号 整数 和 无 符号 整数 的 
机 器 数 均 为 1101 1111 1111 1100B, 作为 无 符号 数 解释 时 的 真 值 为 25 一 1 一 2 一 2 一 1 一 
65535 一 8192 一 3 一 57340。 

16. 符号 位 为 1, 表 示 X 为 负数 。 因 为 [X 析 = 一 1.XXsXsX ,所 以 X 一 
一 0. XXXsX4。 要 使 X> 一 1/2 成 立 ,相当 于 一 0. Xi XXX 之 一 1/2 成 立 , 必须 
0. Xi XXX 一 1/2, 此 时 ,Xi 必须 是 0, 而 XX、X、Xs 任意 。 因 此 ,选项 D 正确 。 

17. 已 知 X= 一 1011= 一 0001011, 符 号 位 为 1 ,数值 部 分 各 位 取 反 , 末 位 加 1, 即 LX]# 一 
11110101 ,正确 的 选项 为 C。 

25. 对 于 选项 A, 因 为 i=12345 达 16384==2* ,所 以 i 的 有 效 位 数 不 会 超过 15 二 24, 因 而 
转换 为 float 型 数据 后 ,不 会 发 生 有 效 位 数 丢失 ,再 转换 为 int 型 数据 ,与 原来 的 值 完全 
相同 。 

对 于 选项 B, 因 为 i 的 有 效 位 数 不 会 超过 15 达 53, 因 而 转换 为 double 型 数据 后 ,不 会 发 
生 有 效 位 数 丢失 ,再 转换 为 int 型 数据 ,与 原来 的 值 完全 相同 。 

对 于 选项 C, 因 为 {=1234.5, 有 小 数 部 分 ,转换 为 int 型 数据 时 ,小 数 部 分 被 丢弃 ,再 转 
换 为 float 型 数据 后 ,与 原来 的 值 不 相同 。 

对 于 选项 D, 因 为 double 型 数据 的 有 效 位 数 比 float 型 的 多 , 表 数 范围 比 float 型 的 大 ， 
因而 将 float 型 数据 转换 为 double 型 数据 ,其 值 不 会 发 生 任何 变化 ,再 转换 为 float 型 数据 ， 
与 原来 的 值 完全 相同 。 

综 上 所 述 ,答案 为 选项 C。 

26. 因为 IBM 370 浮 点 数 格式 的 基数 为 16, 所 以 ,将 一 265. 625 先 转 换 为 十 六 进 制 表示 
形式 ， 

一 265.625 一 一 100001001. 101B 王 一 0001 0000 1001.1010B=( 一 0. 109A)is X16 

根据 IBM 370 的 得 浮 点 数 格 式 , 知 : b= 二 1, b ~b; 二 1000000 十 3 二 1000011B, 即 一 
4b 二 11000011B==C3H, 尾数 bs ~bs1 二 109A00H。 因 此 ,一 265. 625 的 短 浮 点 数 用 十 六 进 制 








表示 为 C3109A00H。 


1. 实现 下 列 各 数 的 转换 。 


2.6 分 析 应 用 题 


(1) (25. 8125)io 一 (?): 一 (?)s 一 (?)1e 
(2) (101101.011): 一 (?)io 一 (?)s 一 (?)16 一 (?)st 
(3) (0101 1001 0110. 0011)81 一 (?)io 一 (?)2 一 (?)1 
(4) (4E.C)w%=(?)1=(?); 


【分 析 解 答 】 


(1) (25.8125)io 三 (1 1001.1101),=(31. 64)s=(19. D)'i 
(2) (101101. 011), = (45. 375)1 = (55. 3)s = (2D. 6)1 = (0100 0101. 0011 0111 


0101)821 


数据 的 机 器 级 表示 


(3) (0101 1001 0110. 0011)s2 一 (596. 3)1o = (1001010100. 010011…): 一 (254. 4…)u 
(4) (4E.C)us 一 (78.75)o 一 (100 1110. 11), 
2. 假定 机 器 数 为 8 位 (1 位 符号 ,7 位 数值 ), 写 出 下 列 各 二 进 制 数 的 原 码 和 补 码 表示 。 


十 0.1001, 一 0. 100 
【分 析 解 答 】 





1, 十 1.0， 


1.0, 十 0.010100， 


上 述 各 二 进 制 数 的 原 码 和 补 码 表示 在 表 2. 1 中 给 出 。 
表 2.1 小 数 的 原 码 和 补 码 表示 


0.010100 ,十 0, 一 0 


























数值 原 码 补 码 
十 0.1001 0. 1001000 0. 1001000 
一 0.1001 1.1001000 1.0111000 
+1.0 溢出 溢出 
一 1.0 溢出 1. 0000000 
十 0.010100 0.0101000 0.0101000 
一 0.010100 1.0101000 1.1011000 
+0 0. 0000000 0. 0000000 
一 0 1.0000000 0. 0000000 








3. 假定 机 器 数 为 8 位 (1 位 符号 ,7 位 数值 ), 写 出 下 列 各 二 进 制 数 的 补 码 和 移 码 表示 。 





十 1001， 
【分 析 解 答 】 


1001, 十 1， 


1, 十 10100， 


10100 ,十 0， 


上 述 各 二 进 制 数 的 补 码 和 移 码 表示 在 表 2. 2 中 给 出 。 


0 


击溃 
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表 2.2 整数 的 补 码 和 移 码 表示 





























数 值 补 码 移 码 ( 偏 置 常数 二 1 0000000) 
十 1001 0 0001001 1 0001001 
一 1001 1 1110111 0 1110111 
十 1 0 0000001 1 0000001 
一 1 1 1111111 0 1111111 
十 10100 0 0010100 1 0010100 
一 10100 1 1101100 0 1101100 
十 0 0 0000000 1 0000000 
一 0 0 0000000 1 0000000 








4. 设 [X]# 王 1. XXaXsX4, 当 X1X2 XsX, 满足 什么 条 件 时 ,XX 二 一 1/2 成 立 ? 


【分 析 解 答 】 


补 码 的 编码 规则 是 :“ 正 数 的 补 码 , 其 符号 位 为 0, 数值 位 不 变 ; 负 数 的 补 码 , 其 符号 位 为 
1, 数 值 位 各 位 取 反 , 末 位 加 1.” 从 形式 上 来 看 ,[LX]# 的 符号 位 为 1, 故 X 一 定 是 负数 。 因 
此 ,绝对 值 越 大 ,数值 越 小 ,因而 要 满足 < 一 1/2, 则 X 的 绝对 值 必须 大 于 1/2。 因 此 ,Xi 
必须 为 0,X,X;X, 至 少 有 一 个 为 1, 这样, 各 位 取 反 末尾 加 1 后 ,Xi 一 定 为 1,X,X;X4 中 至 
少 有 一 个 为 1 ,使 得 X 的 绝对 值 保证 大 于 1/2。 因 此 ,Xi 必须 为 0, XsXsX4 至 少 有 一 个 


为 1。 
5. 已 知 [X]#*，, 求 X。 
(1) [XJ =1110 0001 
(3) [XJ]#=0111 1111 
【分 析 解 答 】 
(1) X=—1 1111B= 一 31 
(3) X=111 1111B=31 


(2) [XJ# =1000 0000 
(4) [XJ]#=1111 1111 


(2) X=—1000 0000B= 一 128 
(4) X=—00000001B= 一 1 


6. 将 以 下 十 进 制 数 表示 成 无 符号 整数 时 至 少 需要 几 个 二 进 制 位 ? 


156 ,820,1200,4503 
【分 析 解 答 】 


2 一 1<156<<2 一 1, 故 至 少 需要 8 位 。 

2 一 1<820<<22 一 1, 故 至 少 需要 10 位 。 
2 一 1<1200<24 一 1, 故 至 少 需要 11 位 。 
22 一 1<4503<<23 一 1, 故 至 少 需要 13 位 。 


7. 假定 某 程序 中 定义 了 3 个 变量 xy 和 z, 其 中 x 和 z 为 int 型 ,y 为 short 型 。 当 x= 
一 258,y 二 一 20 时 ,执行 赋值 语句 z==x 一 y 后 ,存放 z 的 寄存 器 中 的 内 容 是 多 少 ? 


【分 析 解 答 】 


现代 计算 机 中 的 带 符号 整数 都 是 用 补 码 表示 的 ,因此 ,本 题 可 以 直接 计算 z 的 值 ,然后 
将 z 的 补 码 形式 求 出 来 ;也 可 以 先 将 x 和 y 的 补 码 求 出 ,再 通过 补 码 加 法 求 出 z 的 补 码 表 
示 。 显然, 前 一 种 思路 效率 较 高 。 对 于 前 一 种 思路 ,执行 赋值 语句 后 ,z= 一 238, 因 此 ,问题 


发 据 的 机 器 级 表示 


就 变 成 了 求 一 238 的 补 码 表示 ,其 结果 为 [一 000 0000 0000 0000 0000 0000 0000 1110 
1110]# =1111 1111 1111 1111 1111 1111 0001 0010=FFFF FF12H。 

8. 假定 sizeof(int) 二 4, 表 2. 3 中 第 一 列 给 出 了 C 语言 程序 中 的 关系 表达 式 , 请 参照 已 
有 表 栏 内 容 完 成 表 中 后 三 栏 内 容 的 填写 ,并 对 其 中 的 关系 表达 式 2147483647 过 (int) 
2147483648U 的 结果 进行 说 明 。 


表 2.3 关系 表达 式 的 运算 结果 


第 
2 
章 

















关系 表达 式 运算 类 型 | 结果 说 明 
0==0U 
一 1<0 
一 1<0U 无 符号 整数 | 0 11°*1B(2*—1)>00.…0B(0) 
2147483647 之 一 2147483647 一 1 带 符号 整数 | 1 011…1B(23 一 1) 之 100…0B( 一 23) 





2147483647U 二 一 2147483647 一 1 





2147483647<<(int)2147483648U 





一 ] 之 一 2 





(unsigned) 一 1 二 一 2 











【分 析 解 答 】 
按照 题目 要 求 填 表 ,如 表 2.4 所 示 。 


表 2.4 与 表 2.3 对 应 的 关系 表达 式 的 运算 结果 



































关系 表达 式 运算 类 型 | 结果 说 明 

0==0U 无 符号 整数 1 00…0B 王 00…0B 
一 1<0 带 符号 整数 1 11…1B( 一 D)<00…0B(O) 
一 1<0U 无 符号 整数 | 0 11…1B(22 一 1) 之 00…0B(0) 
2147483647 之 一 2147483647 一 1 带 符号 整数 | 1 011…1B(23 一 1) 之 100…0B( 一 23 ) 
2147483647U 之 一 2147483647 一 1 | 无 符号 整数 | 0 011…1B(23 一 1)<<100…0B(22 ) 
2147483647<(int)2147483648U ”| 带 符号 整数 0 011…1B(232 —1)>100*…0B(—2”) 
-= 带 符号 整数 1 11°%*1B(—1)>11*…10B(—2) 
(unsigned)—1>—2 无 符号 整数 11°%*1B(2*—1)>11°…10B(2* 一 2) 

8 个 关系 表达 式 运算 结果 分 别 是 1.1.0.1.0.0.1.1, 其 中 1 表示 “ 真 ”,0 表示 “ 假 >。 关 


系 表达 式 2147483647 < (int ) 2147483648U 的 结果 为 “ 假 >。 因 为 小 于 号 右边 的 
2147483648U 是 一 个 带 后 缀 U 的 整数 ,因而 是 无 符号 整数 ,其 机 器 数 为 100…0(1 后 面 跟 
31 个 0) ,其 值 为 2a。 强 制 类 型 转换 为 int 型 后 , 其 真 值 为 一 23, 即 一 2147483648, 显然 
2147483647 过 一 2147483648 是 不 成 立 的 , 即 结果 为 “ 假 。 

9. 以 下 是 一 个 C 语言 程序 ,用 来 计算 一 个 数组 a 中 每 个 元 素 的 和 。 当 参数 len 为 0 时 ， 
返回 值 应 该 是 0, 但 在 执行 时 却 发 生 了 存储 器 访问 异常 。 请 问 这 是 什么 原因 造成 的 ,并 说 明 
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程序 应 该 如 何 修改 。 
工 float sum _ elements (float a[]，unsigned len) 
2 上 
3 int i; 
4 float result=0; 
5 
6 for (i=0; i<=len-1; i++) 
7 result+=al[il]; 
8 return result; 
9 } 


【分 析 解 答 】 

存储 器 访问 异常 是 由 于 对 数组 a 访问 时 产生 了 越界 或 越权 错误 而 造成 的 。 循 环 变量 i 
是 int 型 , 而 len 是 unsigned 型 , 当 len 为 0 时 ,执行 len-l 的 结果 为 32 个 1, 是 最 大 可 表示 
的 32 位 无 符号 数 ,任何 无 符号 数 都 比 它 小 ,使 得 循环 体 被 不 断 执 行 , 导 致 数组 访问 越界 或 越 
权 , 因 而 发 生存 储 器 访问 异常 。 应 当 将 参数 len 声明 为 int 型 。 

10. 下 列 儿 种 情况 所 能 表示 的 数 的 范围 是 什么 ? 

(1) 16 位 无 符号 整数 。 

(2) 16 位 原 码 定 点 小 数 。 

(3) 16 位 补 码 定点 整数 。 

(4) 下 述 格式 的 浮 点 数 ( 基 数 为 2, 移 码 的 偏 置 常数 为 128, 规格 化 尾数 ,不 考虑 隐 
藏 位 ) 。 





数 符 阶 码 尾数 | 
1 位 8 位 移 码 7 位 原 码 














【分 析 解 答 】 

(1) 16 位 无 符号 整数 范围 为 0~2”* 一 1, 即 0~65 535。 

(2) 16 位 原 码 定 点 小 数 表示 的 范围 为 一 (1 一 2 ) 一 十 (1 一 2 下) 。 

(3) 16 位 补 码 定点 整数 表示 的 范围 为 一 25 一 二 (25 一 1), 即 一 32 768 一 十 32 767。 

(4) 规格 化 浮 点 数 的 表示 范围 如 下 。 

最 大 正 数 : 十 0. 111 1111BX 25n0n00n8 一 十 (1 一 2 )X2227 。 

最 小 正 数 : 十 0. 100 0000BX 2mo "os 一 十 2 一 X2-228 一 十 2-2 。 

最 大 负数 ; 一 0. 100 0000BX 2 oo 一 一 2-1X2-128 一 一 2-129 。 

最 小 负数 : 一 0.111 1111BX2000 三 一 (1 一 2 人 )X22 。 

由 于 原 码 是 关于 原点 对 称 的 ,所 以 , 浮 点 数 的 表示 范围 是 关于 原点 对 称 的 。 

对 于 非 规格 化 浮 点 数 ,其 最 小 正 数 和 最 大 负数 的 尾数 形式 为 士 0. 000 0001, 最 小 正 数 和 
最 大 负数 的 值 为 士 2-7 X2- 世 一 士 2-135 。 

11. 设 某 浮 点 数 格式 如 下 ， 








数 符 阶 码 尾数 | 
1 位 5 位 移 码 6 位 补 码 
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其 中 , 移 码 的 偏 置 常数 为 16, 补 码 采用 一 位 符号 位 和 6 位 数值 位 ,基数 为 4, 规格 化 尾 
数 ,不 考虑 隐藏 位 。 

(1) 用 这 种 格式 表示 下 列 十 进 制 数 : 十 1. 625, 一 0. 125, 十 20, 一 9/16。 

(2) 写 出 该 格式 浮 点 数 的 表示 范围 。 

【分 析 解 答 】 

(1) 十 1.625 一 十 1. 1010B= (十 0.122), X4, 故 阶 码 为 1 十 16= 二 17= 二 10001B, 尾数 为 
四 进 制 数 十 0. 122 的 补 码 , 即 0.01 10 10B, 因 此 ,十 1. 625 表示 为 0 10001 011010。 

一 0.125 二 一 0.0010B=( 一 0. 200), X47!, 故 阶 码 为 一 1 十 16 二 15 二 01111B, 尾数 为 四 
进 制 数 一 0. 200 的 补 码 , 即 1. 10 00 00B, 因 此 ,一 0. 125 表示 为 1 01111 100000。 

十 20= 十 10100B=( 十 0.110),X4, 故 阶 码 为 3 十 16 王 19 王 10011B, 尾数 为 四 进 制 数 
十 0. 110 的 补 码 , 即 0.01 01 00B, 因 此 ,十 20 表示 为 0 10011 010100。 

一 9/16 二 一 0.1001B==( 一 0.210), X4 如 , 故 阶 码 为 0 十 16 二 16 二 10000B, 尾数 为 四 进 制 
数 一 0.210 的 补 码 , 即 1.01 11 00B, 因 此 ,一 9/16 表示 为 1 10000 011100。 

(2) 规格 化 浮 点 数 的 表示 范围 如 下 。 

最 大 正 数 , 十 0. 11 1111BX4u3=( 十 0. 333), X45。 

最 小 正 数 ; 十 0.01 0000BX 4oo 一 (十 0. 100), X4-48 一 十 4 。 

最 大 负数 , 一 0.01 0000BX 4 一 (一 0. 100),X4-8 一 一 4 。 

最 小 负数 : 一 1.00 0000BX4nnB 一 (一 1.000),X45 一 一 45。 

由 于 补 码 表示 的 尾数 不 是 关于 原点 对 称 的 ,所 以 , 浮 点 数 的 表示 范围 不 是 关于 原点 对 








12. 以 IEEE 754 单 精度 浮 点 数 格式 表示 下 列 十 进 制 数 ,要 求 将 结果 写成 十 六 进 制 


十 1. 625 ,一 0.125 ,十 20, 一 9/16 

【分 析 解 答 】 

十 1. 625 一 十 1.101BX22, 所 以 ,符号 s=0, 阶 码 e=0 十 127=0111 1111B, 尾数 的 小 数 
部 分 {==0.101B, 因 此 ,十 1. 625 用 IEEE 754 单 精度 浮 点 数 格式 表示 为 0 011 1111 1 101 
0000 0000 0000 0000 0000, 用 十 六 进 制 形式 表示 为 3FD0 0000H。 

一 0.125 王 一 0.001B= 一 1.0BX2-: ,所 以 ,符号 s=1, 阶 码 e== 一 3 十 127==0111 1100B， 
尾数 的 小 数 部 分 {=0.0B, 因 此 ,一 0.125 用 IEEE 754 单 精度 浮 点 数 格式 表示 为 1 011 1110 
0 000 0000 0000 0000 0000 0000 ,用 十 六 进 制 形式 表示 为 BE00 0000H。 

十 20== 十 10100B= 十 1.01BX2, 所 以 ,符号 s=0, 阶 码 e 一 4 十 127 王 1000 0011B, 尾数 
的 小 数 部 分 {==0.01B, 因 此 ,十 20 用 IEEE 754 单 精 度 浮 点 数 格式 表示 为 0 100 0001 1 010 
0000 0000 0000 0000 0000 ,用 十 六 进 制 形式 表示 为 41A0 0000H。 

一 9/16= 一 0. 1001B= 一 1.001BX2-! ,所 以 ,符号 s==1, 阶 码 e= 一 1 十 127==0111 
1110B, 尾数 的 小 数 部 分 {=0. 001B, 因 此 ,一 9/16 用 IEEE 754 单 精度 浮 点 数 格式 表示 为 
1011 1111 0 001 0000 0000 0000 0000 0000 ,用 十 六 进 制 形式 表示 为 BF10 0000H。 

13. 假定 一 个 float 型 变量 x 的 机 器 数 为 4510 0000H, 则 变量 z 的 值 是 多 少 ? 

【分 析 解 答 】 

float 型 变量 的 机 器 数 对 应 IEEE 754 单 精度 浮 点 数 格式 ,因此 ,将 4510 0000H 展开 为 





| 
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32 位 机 器 数 0 100 0101 0 001 0000 0000 0000 0000 0000 后 ,得 到 其 符号 位 为 0; 阶 码 为 
1000 1010B, 其 阶 (指数 ) 为 1000 1010B 一 127=138 一 127==11; 尾 数 的 值 为 1.001B=1. 125。 
因而 z 的 数值 为 十 1. 125X2" 二 2304。 

14. 设 一 个 变量 的 值 为 2049, 要 求 分 别 用 32 位 补 码 整数 和 IEEE 754 单 精度 浮 点 格式 
表示 该 变量 (结果 用 十 六 进 制 表示 ) ,并 说 明 哪 段 二 进 制 序列 在 两 种 表示 中 完全 相同 ,为 什么 
会 相同 。 

【分 析 解 答 】 

2049 二 1000 0000 0001B== 十 1. 000 0000 0001BX2?, 用 32 位 补 码 整数 表示 为 0000 
0000 0000 0000 0000 1000 0000 0001, 用 十 六 进 制 形式 表示 为 0000 0801H; 用 IEEE 754 单 
精度 浮 点 数 格式 表示 时 ,符号 s=0, 阶 码 e=11 十 127=10001010B, 尾数 的 小 数 部 分 f= 
0. 000 0000 0001B, 因 此 ,2049 用 IEEE 754 单 精 度 浮 点 数 格式 表示 为 0 100 0101 0 000 
0000 0001 0000 0000 0000, 用 十 六 进 制 形式 表示 为 4500 1000H。 

在 上 述 两 种 表示 中 ,存在 相同 的 二 进 制 序列 000 0000 0001。 因 为 2049 被 转换 为 规格 
化 浮 点 数 后 ,有 效 数 值 部 分 中 最 前 面 的 1 被 隐藏 ,其 余数 值 部 分 为 000 0000 0001, 而 2049 
的 32 位 补 码 整数 表示 中 保留 了 完整 的 有 效 数值 部 分 , 即 最 前 面 的 1 没有 被 隐藏 ,所 以 除了 
这 个 1 之 外 后 面 的 二 进 制 序列 000 0000 0001 是 相同 的 。 

15. 设 一 个 变量 的 值 为 一 2147483646 ,要 求 分 别 用 32 位 补 码 整 数 和 IEEE 754 单 精 度 
浮 点 格式 表示 该 变量 (结果 用 十 六 进 制 表示 ) ,并 说 明 哪 种 表示 其 值 完全 精确 和 哪 种 表示 的 
是 近似 值 。 

【分 析 解 答 】 

—2147483646= 一 111 1111 1111 1111 1111 1111 1111 1110B= 一 1.11 1111 1111 1111 
1111 1111 1111 1110X 2 ,32 位 补 码 形式 为 1000 0000 0000 0000 0000 0000 0000 0010 
(8000 0002H) ,IEEE 754 单 精度 格式 为 1 100 1110 1 111 1111 1111 1111 1111 111(CEFF 
FFFFH) ,因为 一 2147483646 在 一 232 一 23 一 1 范围 内 ,可 用 32 位 补 码 精确 表示 ;对 于 IEEE 
754 单 精 度 浮 点 数 格式 ,最 多 只 可 表示 24 位 有 效 二 进位 数字 ,而 一 2147483646 的 有 效 二 进 
位 有 30 位 ,后 面 的 有 效 二 进位 必须 截断 ,因而 是 近似 表示 。 

16. 假定 变量 i、f 和 d 的 数据 类 型 分 别 为 int、float 和 double, sizeof (int) 二 4, 已 知 
i 二 1234567890,f 二 1. 23456789e10, 要 求 给 出 以 下 各 关系 表达 式 的 结果 ,并 说 明 原因 。 

(1) i== (int) (float)i 

(2) i== (int) (double)i 

(3) {== (float) (int)f 

(4) {= = (float) (double)f 

【分 析 解 答 】 

(1) 结果 为 “ 假 >。 因 为 float 类 型 采用 IEEE 754 单 精度 浮 点 数 格式 ,尾数 的 小 数 部 分 
只 有 23 个 二 进位 和 一 位 隐藏 位 ,共有 24 位 有 效 位 数 , 相 应 地 ,十 进 制 有 效 位 数 为 7 位 ,而 i 
中 有 9 位 有 效 位 数 ,因而 将 i 转换 为 float 类 型 时 会 发 生 有 效 数字 的 丢失 ,再 转换 为 int 类 型 
时 ,其 值 已 经 被 改变 了 。 

(2) 结果 为 “ 真 ”。 因 为 double 类 型 采用 IEEE 754 双 精 度 浮 点 数 格式 ,其 有 效 位 数 为 
52 十 1 一 53 个 二 进位 ,而 int 类 型 的 有 效 位 数 有 31 个 二 进位 ,因而 ,对 于 任何 一 个 int 类 型 的 
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变量 ,转换 为 double 后 ,精度 不 会 有 任何 损失 ,再 转换 回 int 类 型 时 ,其 值 不 变 。 

(3) 结果 为 “ 假 >。 因 为 变量 f 的 值 超过 了 int 类 型 可 表示 的 最 大 值 ,因而 将 f 转换 为 int 
类 型 后 再 转换 回 float 类 型 时 ,其 值 已 经 改变 。 

(4) 结果 是 “ 真 ”。 因 为 double 类 型 的 精度 比 float 类 型 高 ,任何 float 类 型 变量 的 值 转 
换 为 double 后 再 转换 回 float 类 型 时 ,其 值 不 变 。 

17. 假定 一 台 32 位 字 长 的 机 器 中 带 符号 整数 用 补 码 表示 , 浮 点 数 用 IEEE 754 标准 表 
示 , 寄 存 器 Rl1 和 R2 的 内 容 分 别 为 8020 0000H 和 0080 0000H。 不 同 指令 对 寄存 器 进行 不 
同 的 操作 ,因而 ,不 同 指令 执行 时 寄存 器 内 容 对 应 的 真 值 不 同 。 假 定 执行 下 列 运 算 指令 时 ， 
操作 数 为 寄存 器 Rl1 和 R2 的 内 容 , 则 Rl 和 R2 中 操作 数 的 真 值 分 别 为 多 少 ? 

(1) 无 符号 数 加 法 指令 。 

(2) 带 符 号 整数 乘法 指令 。 

(3) 单 精度 浮 点 数 减法 指令 。 

【分 析 解 答 】 

寄存 器 R1 的 内 容 为 1000 0000 0010 0000 0000 0000 0000 0000, 寄 存 器 R2 的 内 容 为 
0000 0000 1000 0000 0000 0000 0000 0000。 

(1) 对 于 无 符号 数 加 法 指令 ,R1 和 R2 的 内 容 均 被 解释 成 无 符号 整数 , 即 R1 的 真 值 为 
8020 0000H，R2 的 真 值 为 80 0000H ,也 即 R1 的 真 值 为 29 十 22 ,R2 的 真 值 为 2”。 

(2) 对 于 带 符 号 整数 乘法 指令 ,R1 和 R2 的 内 容 均 被 解释 为 补 码 整 数 ,由 最 高 位 可 知 ， 
R1 为 负数 ，R2 为 正 数 。R1 的 真 值 为 一 0111 1111 1110 0000 0000 0000 0000 0000B= 
一 7FE0 0000H;R2 的 真 值 为 十 80 0000H。 也 即 R1 的 真 值 为 一 (23 一 22 ),R2 的 真 值 为 23 。 

(3) 对 于 单 精度 浮 点 数 减法 指令 ,R1 和 R2 的 内 容 均 为 IEEE 754 单 精度 浮 点 数 表示 。 
由 R1 的 内 容 可 知 , 其 符号 位 为 1, 表 示 负 数 , 阶 码 为 0000 0000, 尾 数 部 分 为 010 0000 0000 
0000 0000 0000 ,因为 阶 码 为 全 0 尾数 为 非 0 数 , 故 Rl 是 非 规格 化 浮 点 数 ,其 指数 为 一 126， 
尾数 为 0.01B, 故 R1 表示 的 真 值 为 一 0.01BX2-* 二 一 27。 由 R2 的 内 容 可 知 ,其 符号 位 
为 0, 表示 正 数 , 阶 码 为 0000 0001 ,尾数 部 分 为 000 0000 0000 0000 0000 0000,R1 为 规格 化 
浮 点 数 ,其 指数 为 1 一 127= 一 126 ,尾数 为 1.0B, 故 R2 表示 的 真 值 为 十 1.0X2-'*=2-1%。 

18. IBM 370 的 短 浮 点 数 格式 中 ,总 位 数 为 32 位 ,左边 第 一 位 (mm ) 为 数 符 , 随 后 7 位 
(bi ~b) 为 阶 码 ,用 移 码 表示 , 偏 置 常 数 为 64 ,右边 24 位 ( 训 一 ps ) 为 6 位 十 六 进 制 原 码 小 数 
表示 的 尾数 ,采用 规格 化 形式 , 基 为 16。 若 将 十 进 制 数 一 260. 125 用 该 浮 点 数 格式 表示 , 则 
对 应 的 机 器 数 是 什么 ? (要 求 用 十 六 进 制 形式 表示 ) 

【分 析 解 答 】 

IBM 370 的 短 浮 点 数 格式 的 尾数 采用 十 六 进 制 原 码 表示 ,基数 是 16。 因 此 ,在 进行 数 
据 转换 时 , 要 先 转化 成 十 六 进 制 形式 。 即 一 260. 125 = 一 0001 0000 0100. 0010B= 
(一 104.2)16 二 (一 0.1042)is X16 。 由 此 可 知 , 浮 点 数 符号 位 应 为 1 ,指数 为 3, 用 7 位 移 码 
表示 为 64 十 3 二 100 0011B, 故 前 8 位 表示 为 1 100 0011 ,对 应 的 十 六 进 制 为 C3H, 尾 数 部 分 
的 6 位 十 六 进 制 数 为 10 4200H, 因 此 ,对 应 的 机 器 数 为 C310 4200H。 

19. 1991 年 2 月 25 日 ,海湾 战争 中 ,美国 在 沙特 阿拉 伯 的 达 摩 地 区 设置 的 爱国 者 导弹 
拦截 伊拉克 的 飞毛腿 导弹 失败 ,致使 飞毛腿 导弹 击 中 了 美国 的 一 个 兵营 ,造成 了 28 名 士兵 
死亡 。 这 是 一 个 浮 点 数 的 精度 问题 造成 的 。 爱 国 者 导弹 系统 中 有 一 个 内 置 时 钟 ,用 计数 器 
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实现 ,每 隔 0. 1s 计数 一 次 。 程 序 用 0. 1 乘 以 计数 器 的 值得 到 以 秒 为 单位 的 时 间 。0. 1 的 二 
进 制 表示 是 一 个 无 限 循环 序列 : 0.00011[0011]…( 方 括 弧 中 的 序列 是 重复 的 )。 请 问 : 

(1) 假定 用 一 个 类 型 为 float 的 变量 x 来 表示 0. 1, 则 变量 x 在 机 器 中 的 机 器 数 是 什么 
(要 求 写成 十 六 进 制 形 式 )? 绝对 值 |x 一 0. 1| 的 值 是 什么 (要 求 用 十 进 制 表示 )? 

(2) 爱国 者 系统 启动 时 计数 器 的 初始 值 为 0, 并 开始 持续 计数 。 假 定 当 时 系统 运行 了 
200 个 小 时 , 则 程序 计算 的 时 间 和 实际 时 间 的 偏差 为 多 少 ? 如 果 爱 国 者 根据 飞毛腿 的 速度 
乘 以 它 被 侦 测 到 的 时 间 来 预测 位 置 , 若 飞毛腿 的 速度 为 2000m/s, 则 预测 偏差 的 距离 为 
多 少 ? 

【分 析 解 答 】 

(1) 0.1=0.0 0011[0011]B= 十 1. 1 0011 0011 0011 0011 0011 00BX2-+ ,float 类 型 采 
用 IEEE 754 单 精度 浮 点 数 格式 。 符 号 位 s 为 0, 阶 码 e=127 一 4=123=0111 1011B, 尾 数 
的 小 数 部 分 为 0. 100 1100 1100 1100 1100 1100, 因 此 ,在 机 器 中 float 型 变量 x 表示 为 0 011 
1101 1 100 1100 1100 1100 1100 1100, 用 十 六 进 制 形式 表示 为 3DCC CCCCH。 由 于 float 
类 型 的 精度 有 限 , 只 有 24 位 有 效 位 数 ,尾数 从 最 前 面 的 1 开始 一 共 只 能 表示 24 位 ,后 面 的 
有 效 数字 全 部 被 截断 , 故 x 与 0. 1 之 间 的 误差 为 | x 一 0. 1|=0. 000 0000 0000 0000 0000 
0000 0000 1100 [1100]B。 这 个 值 约 等 于 0. 11BX2 -2 ,大 约 为 5.59X10"。 

(2) 爱国 者 系统 运行 200 个 小 时 后 ,共计 数 200X60X60X10==72X105 次 。 因 此 , 程 
序 计算 的 时 间 和 实际 时 间 的 偏差 约 为 5.59X10-，X72X105 = 二 0.0402s。 预 测 偏差 距离 约 为 
2000X0.0402=80. 4m。 

20. 假定 浮 点 数 的 阶 码 用 m 位 移 码 表示 , 偏 置 常数 为 2"! 一 1, 规 格 化 尾数 的 整数 部 分 
为 1, 是 隐藏 位 ,小 数 部 分 及 位 ,用 原 码 表示 , 基 为 2。 请 回答 下 列 问 题 。 

(1) 能 用 这 种 浮 点 数 格式 精确 表示 的 最 小 正 整数 是 多 少 ? 

(2) 不 能 用 这 种 浮 点 数 格式 精确 表示 的 最 小 正 整数 是 多 少 ? 

【分 析 解 答 】 

(1) 能 用 这 种 浮 点 数 格式 表示 的 最 小 正 整数 为 1。 

(2) 这 种 浮 点 数 格式 的 有 效 位 数 为 n 十 1 位 ,因此 , 当 某 个 正 整数 的 有 效 位 数 大 于 "十 1 
位 时 , 则 十 1 位 后 的 有 效 数字 被 截断 ,也 即 不 能 用 这 种 浮 点 数 格式 精确 表示 。 因 此 ,不 能 用 
这 种 浮 点 数 格 式 表示 的 最 小 正 整 数 为 十 10…01B( 中 间 有 位 0), 其 值 为 2"+1 十 1。 

21. 图 2.1(a) 是 某 个 C++ 程序 ,图 2.1(b) 是 该 程序 的 若干 组 执行 结果 。 请 根据 IEEE 
754 标准 的 合 入 规定 对 运行 结果 进行 解释 说 明 ,并 通过 分 析 得 出 float 变量 的 有 效 位 数 。 

【分 析 解 答 】 

该 程序 的 功能 非常 简单 ,就 是 从 键盘 上 输入 一 个 实数 , 赋 给 一 个 float 型 变量 后 再 从 屏 
幕 上 输出 。 从 运行 结果 来 看 ,61. 419998 和 61. 420002 是 两 个 可 表示 数 , 两 者 之 间 相差 
0.000004。 当 输入 数据 是 一 个 不 可 表示 数 时 ,机 器 将 其 转换 为 最 邻近 的 可 表示 数 。 

目前 几乎 所 有 机 器 中 float 型 变量 都 是 采用 IEEE 754 单 精度 浮 点 数 格式 表示 ,其 二 进 
制 有 效 位 数 为 24 位 ,因此 能 精确 表示 的 十 进 制 有 效 位 数 为 7 位 。 因 为 61==111101B= 
1.11101BX2 ,如果 将 float 型 数据 的 规格 化 正 数 的 表示 范围 以 2 (一 126<i<127) 为 分 割 
点 划分 成 若干 区 间 ,61. 419998 应 该 位 于 区 间 [2 ,2*] ,该 区 间 相 邻 可 表示 数 之 间 的 间隔 为 
2 33X25 一 2 一 0.0000038…s0.000004, 从 上 述 分 析 结 果 来 看 ,该 区 间 相 邻 两 个 可 表示 数 
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#include <iostream> 
lusing namespace std; 

















lint main() Please enter a nunber: 61.419997 
{ 61.419998 
Es Pl ber: 61.419998 
cout. setf (ios: :fixed, iosa::floatfield); ae et er Aber 
while(1) 61.419998 
{ Please enter a nunber: 61.419999 
Cout << "Please enter a number: "; 61.419998 
Se Please enter a mmber: 61.42 
cout<<headac<endl; 
} 61.419998 
Please enter a nunber: 61.420001 
return 0; 61.420002 
} Please enter a nunber: 
(a) C++ 源 程序 (b) 程序 运行 结果 


图 2.1 源 程序 及 其 运行 结果 示例 


之 间 的 间隔 就 是 0.000004。 因 此 ,在 61. 419998 前 面 的 可 表示 数 为 61. 419994, 后 面 的 可 表 
示 数 为 61. 420002。 

显然 , 当 输 入 61. 419997 和 61. 419999 时 ,其 最 靠近 的 可 表示 数 为 61. 419998; 而 
61. 420001 的 最 邻近 可 表示 数 为 61. 420002; 当 输入 为 61. 42 时 ,从 十 进 制 形式 61. 42000 来 
看 , 它 位 于 可 表示 数 61. 419998 和 61. 420002 的 中 点 ,但 是 ,实际 上 机 器 内 部 是 按照 二 进 制 
表示 来 判断 的 ,从 二 进 制 表示 形式 来 看 ,61. 42 应 该 更 靠近 61. 419998 ,因此 ,61. 42 对 应 输 
出 的 可 表示 数 为 61. 419998 。 

22. 假定 在 一 个 程序 中 定义 了 变量 xy 和 i, 其 中 ,x 和 y 是 float 型 变量 (用 IEEE 754 
单 精度 浮 点 数 表示 ),i 是 16 位 short 型 变量 (用 补 码 表示 )。 程 序 执行 到 某 一 时 刻 , x 二 
一 130.y=7.25,i=130, 它 们 都 被 写 到 了 主 存 ( 按 字 节 编 址 ) ,其 地 址 分 别 是 &x、&y 和 &i。 
请 分 别 给 出 在 大 端 机 器 和 小 端 机 器 上 变量 xy 和 i 在 内 存 的 存放 位 置 。 

【分 析 解 答 】 

x 二 一 130= 一 100 00010B= 一 1.00 0001BX27, 阶 码 e=127 十 7=128 十 6 二 1000 0110， 
所 以 ,用 IEEE 754 单 精度 浮 点 数 表示 为 1 100 0011 0 000 0010 0000 0000 0000 0000==C302 
0000H。 

y=7.25=111.01B= 十 1. 1101BX 22 , 阶 码 e=127 十 2=128 十 1 王 1000 0001, 所 以 ,用 
IEEE 754 单 精度 浮 点 数 表 示 为 0 100 0000 1 110 1000 0000 0000 0000 0000==40E8 0000H。 

i 二 130==1000 0010B, 用 16 位 补 码 表示 为 0082H。 

上 述 3 个 数据 在 大 端 机 器 和 小 端 机 器 上 的 存放 位 置 如 表 2.5 所 示 。 


表 2.5 数据 在 大 端 和 小 端 机 器 中 的 存放 位 置 


























地 址 大 端 机 器 小 端 机 器 
Bx C3H 00H 
&x 十 1 02H 00H 
&x 十 2 00H 02H 
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续 表 
地 址 大 端 机 器 小 端 机 器 
&x+3 00H C3H 
&y 40H 00H 
&y+1 E8H 00H 
&y 十 2 00H E8H 
Byt3 00H 40H 
&i 00H 82H 
&i 二 1 82H 00H 








23. 假定 某 计算 机 存储 器 按 字 节 编 址 ,CPU 从 存储 器 中 读 出 一 个 4 字 节 信息 D=3234 
3538H, 该 信息 的 内 存 地 址 为 0000 F00CH , 按 小 端 方式 存放 ,请 回答 下 列 问题 。 

(1) 该 信息 D 占用 了 几 个 内 存单 元 ?” 这 几 个 内 存单 元 的 地 址 及 其 内 容 各 是 什么 ? 

(2) 若 D 是 一 个 32 位 无 符号 数 , 则 其 值 是 多 少 ? 

(3) 若 D 是 一 个 32 位 补 码 表示 的 带 符号 整数 , 则 其 值 是 多 少 ? 

(4) 若 D 是 一 个 IEEE 754 单 精 度 浮 点 数 , 则 其 值 是 多 少 ? 

(5) 若 D 是 一 个 用 8421 码 表示 的 无 符号 整数 , 则 其 值 是 多 少 ? 

(6) 若 D 是 一 个 字符 串 , 每 个 字 节 的 低 7 位 表示 对 应 字符 的 ASCII 码 , 则 对 应 字符 串 是 
什么 ? 

(7) 若 D 是 两 个 汉字 的 国标 码 , 则 这 两 个 汉字 在 GB 2312 字符 集 码 表 中 分 别 位 于 哪 一 
行 和 哪 一 列 ? 

(8) 若 D 中 前 3 个 字 节 分 别 是 一 个 像素 的 R.G、B 分量 的 颜色 值 , 则 其 值 各 是 多 少 ? 

【分 析 解 答 】 

将 3234 3538H 展开 为 二 进 制 表示 为 0011 0010 0011 0100 0011 0101 0011 1000B。 

(1) 因为 存储 器 按 字 节 编 址 ,所 以 4 个 字 节 占用 4 个 内 存单 元 ,其 地 址 分 别 是 0000 
Fo0CH .0000 F00DH、0000 F00EH .0000 F00FH。 由 于 采用 小 端 方式 存放 ,所 以 ,最 低 有 效 
字 节 38H 存放 在 0000 FO00CH 中 ,35H 存放 在 0000 F00DH 中 ,34H 存放 在 0000 F00EH 
中 ,32H 存放 在 0000 FOOFH。 

(2) 无 符号 数 。 值 为 28 十 228 十 25 十 22 十 22 十 28 十 23 十 22 十 20 十 28 十 25 十 24 十 23 。 

(3) 补 码 整数 。 符 号 为 0, 表 示 其 为 正 数 ,其 值 与 无 符号 数 的 值 一 样 。 

(4) IEEE 754 单 精度 浮 点 数 。 根 据 IEEE 754 单 精度 浮 点 数 格式 可 知 ,符号 位 s=0 ,为 
正 数 ; 阶 码 e=0110 0100B=100, 故 阶 为 100 一 127= 一 27; 尾 数 小 数 部 分 {=0. 011 0100 
0011 0101 0011 1000, 所 以 ,其 值 为 1. 011 0100 0011 0101 0011 1BX27 ?7。 

(5) 8421 码 整数 。3234 3538H 各 位 表示 对 应 十 进 制 数 32343538, 所 以 ,其 值 
为 32343538 。 

(6) ASCII 码 字 符 串 。 各 字 节 的 低 7 位 分 别 为 011 0010.011 0100.011 0101.011 1000， 
所 以 ,对 应 的 字符 串 为 2458。 

(7) 汉字 。 对 国标 码 每 个 字 节 各 自 减 20H, 得 到 两 个 汉字 的 区 位 码 ,分 别 为 1214H 和 


数据 的 机 器 级 表示 


1518H, 也 即 , 第 一 个 汉字 在 GB 2312 字符 集 码 表 中 位 于 第 18(12H) 行 .第 20(14H) 列 ,第 
二 个 汉字 位 于 第 21(15H) 行 .第 24(18H) 列 。 

(8) 颜色 值 。 该 像素 的 R.G、B 分 量 的 颜色 值 分 别 为 0011 0010B== 50,0011 0100B= 
52,0011 0101B=53。 

24. 已 知 下 列 字符 的 ASCII 码 : A=100 0001,a=110 0001,0=011 0000, 求 Dd、6 的 
7 位 ACSII 码 和 第 一 位 前 加 入 奇 校 验 位 后 的 8 位 编码 。 

【分 析 解 答 】 

D 的 ASCII 码 为 100 0001 十 011==100 0100, 前 面 加 奇 校 验 位 后 的 编码 是 1 100 0100。 

d 的 ASCII 码 为 110 0001 二 011=110 0100 ,前 面 加 奇 校 验 位 后 的 编码 是 0 110 0100。 

6 的 ASCII 码 为 011 0000 十 110==011 0110 ,前 面 加 奇 校 验 位 后 的 编码 是 1 011 0110。 

25. 某 数据 为 1110 0101B, 采 用 奇 校 验 和 CRC 校 验 (生成 多 项 式 为 x! 十 x 十 1) 对 应 的 
校 验 码 各 是 什么 ? 

【分 析 解 答 】 

采用 奇 校 验 时 ,因为 数据 中 有 奇数 个 1 , 故 校 验 位 为 0; 采 用 CRC 校 验 时 ,生成 多 项 式 为 
好 十 z 十 1, 故 有 4 个 校 验 位 。 首 先 在 数据 后 面 添 4 个 0, 得 到 1110 0101 0000B, 再 将 它 和 
10011 进行 模 2 除法 ,得 到 余数 为 1100B, 所 以 校 验 码 为 1100B。 

26. 假定 某 计算 机 的 总 线 采 用 偶 校 验 ,每 8 位 数据 有 一 位 校 验 位 , 若 在 32 位 数据 线 上 
传输 的 信息 是 1234 5678H, 则 对 应 的 4 个 校 验 位 应 为 什么 ? 若 接收 方 收 到 的 数据 信息 和 校 
验 位 分 别 为 1235 5678H 和 0100B, 则 说 明 发 生 了 什么 情况 ,给 出 验证 过 程 。 

【分 析 解 答 】 

总 线 上 传输 的 4 个 字 节 分 别 为 0001 0010,0011 0100,0101 0110,0111 1000B, 因 此 对 应 
的 4 个 偶 校 验 位 P0~P3 分 别 为 0,1,0,0。 当 接收 方 收 到 数据 信息 1235 5678H 和 校 验 位 
0100B 后 ,进行 如 下 验证 : 

第 1 字 节 ; 数据 为 12H=0001 0010B, 故 偶 校 验 位 Ps 二 0,0 @0=0, 说 明 传输 正确 。 

第 2 字 节 : 数据 为 35H=0011 0101B, 故 偶 校 验 位 已 =0,0 @ 1=1, 说 明 传 输 错误 。 

第 3 字 节 : 数据 为 55H=0101 0110B, 故 偶 校 验 位 P;==0,0 名 0=0, 说 明 传 输 正确 。 

第 4 字 节 : 数据 为 78H=0111 1000B, 故 偶 校 验 位 P;=0,0 @@ 0=0, 说 明 传输 正确 。 

27. 假定 一 个 16 位 数据 Mis Mis Mi Mis Mis Mi MioMs Ms M1MeMsMMsMMi 为 0111 
1000 1101 0010B, 要 求 写 出 该 16 位 数据 的 SEC 码 ( 单 检 错 码 ) ,并 说 明 SEC 码 如 何 正确 检 
测 数据 位 Ms 的 错误 。 

【分 析 解 答 】 

对 于 16 位 数据 的 单 检 错 码 ,其 校 验 位 P 和 故障 字 S 都 是 5 位 。 假 定 故 障 字 $= 
SsS4SsSsSi 的 值 反映 出 错 数据 位 或 校 验 位 的 位 置信 息 , 则 得 到 码 字 排 列 和 故障 字 的 取 值 
如 下 : 

Mis Mis Mas Mis Mis Ps Mi Mio Ms Ms M1; Ms Ms P, Ms Ms Ms Ps Mi Ps Pi 

= 0 
G00 
站 
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So oo 
0 
根据 上 表 , 得 到 各 个 校 验 位 的 计算 公式 如 下 : 
P=M@M,OMOMOMOMOMOM OM,OMOM 
P=M®@M;OM,OMOMOM OM OM:OM, 
P; = M,@M;@M,OMO@M,OM,.OM OM:®M 
2 = Ms; OMOM ©®Ms @M, ®@My 四 M， 
P;=M:®@M:@OM.@OM:OM 
当 数 据 字 为 0111 1000 1101 0010B 时 ,代入 上 述 公式 ,得 到 校 验 位 P=P; P, P; P,P1= 
00011B。 若 第 5 位 数据 Ms 出 错时 ,数据 字 变 为 0111 1000 1100 0010B ,代入 上 述 公 式 , 得 
到 P'=Ps PiPsPsPi 二 01010B, 因 而 ,故障 字 S=S;S,S;S,Si 二 00011 @01010==01001B, 从 
上 表 可 知 ,Ms 出 错 。 
28. 假设 要 传送 的 数据 信息 为 111 0001B, 若 约定 的 生成 多 项 式 为 : G(x) 二 十 1, 则 校 
验 码 为 多 少 ? 假定 在 接收 端 接收 到 的 数据 信息 为 111 0011B, 说 明 如 何 正确 检测 其 错误 , 写 
出 检测 过 程 。 
【分 析 解 答 】 
原 数 据 信息 为 111 0001B, 对 应 的 报 文 多 项 式 为 M(x) 二 x 十 十 xz! 十 1, 生 成 多 项 式 的 
位 数 为 4 位 ,因此 , 校 验 码 的 位 数 为 3 位 。 在 原 数据 信息 后 面 添加 3 个 0, 得 到 M' (x)= 
TM(z)=zw 十 x 十 x' 十 x ,用 M' (zx) 去 模 2 除 G(x), 得 到 余数 110B, 因 此 ,在 发 送 端 要 传 
送 的 CRC 码 为 111 0001 110B。 在 接收 端 收 到 的 数据 位 为 111 0011B, 假 定 CRC 码 中 的 校 
验 位 在 传送 过 程 中 没有 出 错 ,在 接收 端 还 是 110B, 则 在 接收 端 对 数据 校 验 时 ,将 接收 端的 
CRC 码 111 0011 110B 用 生成 多 项 式 G(x) 进 行 模 2 除 ,得 到 的 余数 为 010B, 余 数 不 为 0, 表 
明 传输 时 发 生 了 错误 。 





运算 方法 和 运算 部 件 


3.1 教学 目标 和 内 容 安 排 


主要 教学 目标 : 使 学 生 掌 握 核心 运算 部 件 ALU 以 及 计算 机 内 部 各 种 基本 运算 算法 和 
运算 部 件 , 能 够 运用 所 学 知识 分 析 和 解释 高 级 语言 和 机 器 级 语言 程序 设计 中 遇 到 的 各 种 问 
题 和 相应 的 执行 结果 。 

基本 学 习 要 求 : 

(1) 了 解 高 级 程序 设计 语言 和 低级 程序 设计 语言 中 涉及 的 各 种 运算 。 

(2) 掌握 定点 数 的 逻辑 移 位 算术 移 位 和 扩展 操作 方法 。 

(3) 了 解 原 码 加 减 运算 的 基本 原理 。 

(4) 掌握 补 码 加 减 运 算 方法 ,并 能 设计 补 码 加 减 运算 器 。 

(5) 了 解 定点 数 乘 法 和 除法 运算 的 基本 思想 。 

(6) 了 解 专用 的 阵列 乘法 器 和 阵列 除法 器 的 基本 思想 。 

(7) 理解 为 何在 运算 中 会 发 生 溢出 ,并 掌握 各 类 定点 数 运算 的 溢出 判断 方法 。 

(8) 掌握 浮 点 数 加 减 运算 过 程 和 方法 。 

(9) 理解 [EEE 754 标准 对 附加 位 的 添加 以 及 合 入 模式 等 方面 的 规定 。 

(10) 了 解 浮 点 数 乘法 和 除法 运算 的 基本 思想 。 

(11) 掌握 算术 逻辑 单元 (ALU) 的 功能 和 结构 。 

(12) 了 解囊 行 加 法 器 和 快速 并 行 加 法 器 的 基本 工作 原理 。 

(13) 了 解 定点 运算 器 ( 即 定点 运算 数据 通路 ) 的 基本 结构 。 

(14) 了 解 浮 点 数 加 减 运 算 器 的 基本 结构 。 


本 章 涉及 各 种 类 型 数据 的 各 种 运算 算法 和 运算 电路 ,因此 内 容 多 而 烦琐 。 特别 是 原 码 
加 减 运算 和 各 种 类 型 的 乘除 运算 ,它们 的 基本 原理 都 很 简单 ,但 实现 起 来 非常 复杂 。 在 课堂 
教学 中 ,这 些 内 容 往 往 占用 很 多 课时 ,而且 烦 琐 的 步骤 和 一 些 算法 规定 也 经 常 使 得 学 生 感 觉 
枯燥 无 味 。 这 些 内 容 在 本 课程 内 容 框架 体系 中 不 属于 主干 内 容 , 对 这 些 内 容 掌握 的 好 坏 与 
深浅 程度 基本 不 会 影响 学 生 对 其 他 知识 的 学 习 。 因 此 ,对 于 原 码 加 减 运算 ,只 要 根据 现实 世 
界 中 十 进 制 加 减 运 算 规则 去 理解 ,把 原理 讲 清楚 就 行 了 ,没有 必要 让 学 生死 记 硬 背 运算 规 
则 ;对 于 乘法 运算 ,只 要 将 原 码 一 位 乘法 和 补 码 一 位 乘法 ( 布 斯 乘法 ) 的 基本 原理 、 两 位 一 乘 
算法 的 基本 思想 以 及 阵列 乘法 器 的 基本 思想 讲 清楚 就 行 了 。 对 于 除法 运算 ,只 要 将 原 码 除 
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法 运算 的 基本 原理 , 补 码 除法 运算 的 特点 以 及 阵列 除法 器 的 基本 思想 讲 清楚 就 行 了 。 对 于 
乘除 运算 的 学 习 , 其 主要 目的 不 是 学 会 怎样 模拟 计算 机 进行 乘除 运算 ,而 是 能 够 认识 到 乘除 
运算 的 算法 复杂 性 和 相对 较 大 的 时 间 开 销 ,并 且 认识 到 不 同 实现 方法 的 时 间 开 销 是 不 同 的 ， 
这 种 不 同 主要 是 由 于 运算 部 件 控制 方式 的 不 同 而 造成 的 。 

课时 有 限 的 情况 下 ,有 关 原 码 加 减 运算 ,两 位 乘法 运算 、 补 码 除法 运算 .阵列 乘法 器 、 阵 
列 除法 器 、 浮 点 数 乘除 运算 、 定 点 运算 部 件 、 浮 点 运算 部 件 等 加 * * ”的 部 分 ,都 可 以 只 用 一 两 
句 话 概 括 基 本 思想 或 提出 问题 以 引起 学 生 进一步 思考 并 课 后 阅读 ,无 须 占用 大 量 的 课堂 时 
间 来 介绍 细节 内 容 。 

为 了 增强 学 生 对 计算 机 内 部 各 类 运算 算法 的 认识 ,可 以 让 学 生 亲自 编写 相关 的 程序 , 通 
过 程序 的 执行 结果 来 理解 本 章 所 学 的 知识 。 与 本 章 内 容 相 关 的 编程 练习 示例 如 下 。@ 〇 给 定 
一 组 无 符号 数 和 带 符号 整数 变量 的 值 ,对 其 进行 移 位 操作 后 ,查看 其 结果 ,并 进行 分 析 解 释 ; 
加 对 于 某 个 负数 ,如 一 4098 ,将 该 数 赋值 给 一 个 short 类 型 变量 ,然后 将 其 转换 为 unsigned 
short ,int unsigned int float 等 类 型 ,查看 其 结果 ,并 进行 分 析 解 释 ; @) 对 于 某 个 大 的 正 整 
数 , 如 2147483647( 即 22 ) ,将 该 数 赋值 给 某 个 int 类 型 变量 ,再 将 其 转换 为 short、unsigned 
short unsigned int,float 等 类 型 ,查看 其 结果 ,并 进行 分 析 解 释 ; @@ 对 于 某 个 有 效 位 数 多 于 
8 的 浮 点 数 ,如 123456. 789e5 ,将 其 定义 为 float 型 变量 ,然后 转换 为 double 型 变量 ;再 反 过 
来 将 double 型 转换 为 float 型 ,查看 其 结果 ,并 进行 分 析 解 释 ; @ 对 于 各 类 运算 ,给 出 一 些 特 
殊 的 例子 ,以 进行 “溢出 “大 数 吃 小 数 ” 等 方面 的 验证 ,并 分 析 结 果 以 给 出 合理 的 解释 。 例 
如 ,对 于 无 符号 数 ( 如 unsigned int) ,要 求 计算 1 十 4294967295 二 ?,1 一 4294967295 二 ?。 对 
于 带 符号 整数 (如 int) ,要 求 计算 2147483647 十 1==?, 一 2147483648 一 1 二 ?。 对 于 浮 点 数 ， 
要 求 分 别 计算 (1. 0 十 123456. 789e30) 十 (一 123456. 789e30) 和 1. 0 十 (123456. 789e30 十 
(123456. 789e30)) ,查看 两 个 结果 是 否 一 致 ,等 等 。 


3.2 主要 内 容 提要 














1. 加 法 器 

根据 进位 方式 的 不 同 , 有 3 种 基本 加 法 器 : 行 波 进位 加 法 器 .进位 选择 加 法 器 和 先行 
(超前 ) 进 位 加 法 器 。 行 波 进位 加 法 器 通过 将 多 个 一 位 全 加 器 串 行 连接 ,各 进位 串 行 传递 , 速 
度 慢 ; 进 位 选择 加 法 器 通过 选择 两 个 分 别 带 进位 0 和 1 的 高 位 部 分 加 法 器 的 输出 来 实现 高 、 
低 两 部 分 的 并 行 执行 ,使 运算 时 间 减 半 ; 先 行 (超前 ) 进 位 加 法 器 通过 “进位 生成 "和 “进位 传 
递 ” 函 数 来 使 各 进位 独立 、 并 行 产 生 , 速 度 快 。 可 用 单 级 、 两 级 或 更 多 级 先行 进位 方式 连接 。 
采用 先行 进位 方式 能 加 快 加 法 器 速度 ,目前 多 用 这 种 方式 。 

2. 算术 逻辑 单元 (ALU) 

在 先行 进位 加 法 器 的 基础 上 增加 其 他 逻辑 构成 ALU, 以 实现 基本 的 加 / 减 算术 运算 和 
基本 旭 辑 运算 。ALU 有 两 个 操作 数 输 入 一 位 进位 输入 一 个 操作 控制 输入 ,一 个 结果 输 
出 一 位 进位 输出 以 及 零 标 志 (ZF) 和 溢出 标志 (OF) 等 输出 。 

3. 定点 运算 及 定点 运算 器 

定点 运算 由 专门 的 定点 运算 器 实现 ,其 核心 部 件 是 带 先 行进 位 加 法 器 的 ALU ,在 控制 
逻辑 的 控制 下 ,可 进行 各 种 旭 辑 运算 和 算术 运算 。 除 基本 逻辑 运算 外 ,主要 的 运算 包括 以 下 
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几 种 。 

(1) 移 位 运算 : 包括 逻辑 移 位 .算术 移 位 和 循环 移 位 。 逻 辑 移 位 对 无 符号 数 进行 , 移 位 
时 ,在 空 出 的 位 补 0, 左 移 时 可 根据 移出 位 是 否 为 1 来 判断 溢出 ;算术 移 位 对 带 符号 整数 进 
行 , 移 位 前 后 符号 位 保持 不 变 , 否 则 溢出 ;循环 移 位 时 不 需要 考虑 溢出 。 左 移 一 位 ,数值 扩大 
一 倍 ,相当 于 乘 2 操作 ; 右 移 一 位 ,数值 缩小 一 半 ,相当 于 除 2 操作 。 

(2) 扩展 运算 : 包括 零 扩 展 和 符号 扩展 。 零 扩展 对 无 符号 数 进行 ,高 位 补 0; 符 号 扩展 
对 带 符号 整数 进行 ,因为 用 补 码 表示 ,所 以 在 高 位 直接 补 符号 。 

(3) 整数 加 减 运算 : 包括 补 码 加 减 、 原 码 加 减 和 移 码 加 减 运 算 。 补 码 加 减 运算 用 于 带 
符号 整数 ,符号 位 和 数值 位 一 起 运算 。 同 号 相 加 时 , 若 结果 的 符号 不 同 于 加 数 的 符号 , 则 会 
发 生 溢出 。 因 为 IEEE 754 标准 用 原 码 小 数 表示 尾数 ,所 以 原 码 加 减 运 算 用 于 浮 点 数 的 尾 
数 ,符号 位 和 数值 位 分 开 运 算 , 同 号 数 相 加 或 异 号 数 相 减 时 ,做 加 法 ; 同 号 数 相 减 或 异 号 数 相 
加 时 ,做 减法 。 因 为 IEEE 754 标准 用 移 码 表示 指数 ,所 以 移 码 加 减 运算 用 于 浮 点 数 的 指 
数 , 移 码 的 和 、 差 等 于 和 、 差 的 补 码 ,因此 ,可 通过 移 码 先 求 出 和 、 差 的 补 码 , 最 后 将 符号 取 反 ， 
就 能 得 到 和 、 差 的 移 码 表示 。 减 法 运算 电路 只 要 在 加 法 器 基础 上 增加 求 补 和 溢出 判断 电路 ， 
并 将 进位 输入 段 用 于 加 减 控制 就 可 实现 ,因此 ,所 有 的 减法 运算 都 是 用 加 法 器 实现 的 。 

(4) 整数 乘法 运算 : 包括 无 符号 数 乘法 , 补 码 乘法 和 原 码 乘 法 ,都 可 用 加 减 及 右 移 运算 
实现 。 无 符号 数 乘法 用 于 无 符号 整数 。 补 码 乘 法 用 于 带 符号 整数 ,符号 位 和 数值 位 一 起 运 
算 , 可 采用 布 斯 (Booth) 算 法 或 MBA 算法 。 原 码 乘法 用 于 浮 点 数 尾数 ,符号 位 和 数值 位 分 
开 运算 ,数值 部 分 用 无 符号 数 乘法 实现 。 除 了 可 以 在 定点 运算 部 件 中 用 加 法 和 右 移 来 实现 
乘法 运算 以 外 ,也 可 用 基于 CSA 的 阵列 乘法 器 .流水线 乘法 器 .MBA 十 WT 乘法 器 等 实现 。 
两 个 ”位 数 相 乘 得 到 2n 位 数 乘积 , 若 结 果 只 取 低 位 , 则 乘积 高 n 位 必须 是 0( 无 符号 数 乘 
法 ) 或 是 符号 ( 补 码 乘法 ) ,否则 溢出 。 若 采用 一 位 乘法 算法 , 则 位 数 相 乘 大 约 需 要 n 次 加 
减 运算 入 次 右 移 运算 。 

(5) 整数 除法 运算 : 包括 无 符号 数 除 法 、 补 码 除法 和 原 码 除法 ,都 可 用 加 减 及 左 移 运算 
实现 。 无 符号 数 除 法 用 于 无 符号 整数 ,有 恢复 余数 法 和 不 恢复 余数 法 两 种 。 补 码 除法 用 于 
带 符号 整数 ,符号 位 和 数值 位 一 起 运算 ,也 有 恢复 余数 法 和 不 恢复 余数 法 两 种 。 原 码 除法 用 
于 浮 点 数 尾数 ,符号 和 数值 分 开 运算 ,数值 部 分 用 无 符号 数 除 法 实现 。 因 为 除法 运算 无 法 事 
先 确定 做 加 法 还 是 减法 ,所 以 无 法 实现 流水 线 除 法 器 。 两 个 ”位 数 相 除 时 ,需要 将 被 除数 扩 
展 成 2n 位 数 , 对 于 不 恢复 余数 法 ,n 位 数 除法 大 约 需要 n 次 加 减 运算 和 次 左 移 运算 。 

4. 浮 点 运算 及 浮 点 运算 器 

计算 机 中 大 多 用 IEEE 754 标准 表示 浮 点 数 ,因此 , 浮 点 运算 主要 针对 IEEE 754 标准 
浮 点 数 。 浮 点 运算 由 专门 的 浮 点 运算 器 实现 ,因为 一 个 浮 点 数 由 一 个 定点 小 数 和 一 个 定点 
整数 组 成 ,所 以 浮 点 运算 器 由 定点 运算 部 件 构成 ,其 核心 部 件 还 是 带 先行 进位 加 法 器 的 
ALU。 浮 点 运算 包括 浮 点 加 减 运算 和 浮 点 乘除 运算 。 

(1) 浮 点 加 减 运算 : 按照 对 阶 , 尾 数 加 减 、 规 格 化 , 舍 和 信和 溢出 判断 几 个 步骤 完成 。 对 
阶 时 小 阶 向 大 阶 看 齐 , 阶 小 的 那个 数 的 尾数 右 移 ,直到 两 数 阶 码 相 同 , 右 移 时 一 般 保留 两 位 
或 三 位 附加 位 ;尾数 加 减 时 用 原 码 加 减 运算 实现 ;规格 化 处 理 时 根据 结果 的 尾数 形式 的 不 同 
确定 进行 左 规 或 右 规 操 作 ; 舍 人 操作 有 就 近 伟 人 、 正 向 伟人 、 负 向 伟人 和 截 去 4 种 方式 ,默认 
的 是 就 近 伟人 到 偶数 方式 ;溢出 判断 主要 根据 结果 的 阶 码 进行 判断 , 当 发 生 阶 码 上 滋 时 , 运 
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算 结 果 发 生 溢出 , 当 发 生 阶 码 下 溢 时 ,运算 结果 近似 为 0。 
(2) 浮 点 乘除 运算 : 尾数 用 原 码 小 数 的 乘 / 除 运算 实现 , 阶 码 用 移 码 加 减 运算 实现 , 需 
要 对 结果 进行 规格 化 .伟人 和 溢出 判断 。 


3.3 基本 术语 解释 


逻辑 移 位 (logical shift) 

逻辑 移 位 是 对 无 符号 数 进行 的 移 位 ,把 无 符号 数 看 成 一 个 巡 辑 数 进行 移 位 操作 。 左 移 
时 ,高 位 移出 ,低位 补 0; 右 移 时 ,低位 移出 ,高 位 补 0。 

算术 移 位 (arithmetic shift) 

算术 移 位 是 对 带 符号 整数 进行 的 , 移 位 前 后 符号 位 不 变 。 移 位 时 ,符号 位 不 动 , 只 是 数 
值 部 分 进行 移 位 。 左 移 时 ,高 位 移出 ,未 位 补 0, 移 出 非 符 时 ,发 生 溢出 。 右 移 时 高 位 补 符 ， 
低位 移出 。 移 出 时 进行 舍 人 操作 。 

循环 (逻辑 ) 移 位 (rotating shift) 

循环 移 位 是 一 种 逻辑 移 位 , 移 位 时 把 高 ( 低 ) 位 移出 的 一 位 送 到 低 (高 ) 位 , 即 ; 左 移 时 ， 
各 位 左 移 一 位 ,并 把 最 左边 的 位 移 到 最 右边 ; 右 移 时 ,各 位 右 移 一 位 ,并 把 最 右边 的 位 移 到 最 
左边 。 

扩展 操作 (extending) 

在 计算 机 内 部 ,有 时 需要 将 一 个 取 来 的 短 数 扩展 为 一 个 长 数 ,此 时 要 进行 填充 (扩展 ) 处 
理 。 有“ 零 扩展 "和 “符号 扩展 ”两 种 。 

零 扩展 (Zero extending) 

对 无 符号 整数 进行 高 位 补 0 的 操作 称 为 * 零 扩展 ”。 

符号 扩展 (sign extending) 

对 补 码 整数 在 高 位 直接 补 符 的 操作 称 为 “符号 扩展 ” 

扩展 器 (extender) 

进行 扩展 (填充 ) 操 作 的 部 件 , 一 般 输入 为 nn 位 ,输出 为 2n 位 。 

半 加 器 (half adder) 

只 考虑 本 位 两 个 加 数 而 不 考虑 低位 进位 来 生成 本 位 和 的 一 位 加 法 器 。 

全 加 器 (full adder,(3，2)adder) 

不 仅 考虑 本 位 两 个 加 数 ,而 且 考 虑 低位 进位 来 生成 本 位 和 的 一 位 加 法 器 。 

加 法 器 (adder) 

能 进行 n 位 加 法 运算 的 部 件 。 

行 波 进位 (ripple carry) 

在 进行 n 位 加 法 运算 时 ,低位 向 高 位 的 进位 采用 像 “ 行 波 ” 一 样 串 行 传递 的 方式 。 

行 波 进位 加 法 器 (ripple carry adder) 

也 称 为 串 行进 位 加 法 器 , 它 通过 个 全 加 器 按照 串 行 方式 连 起 来 实现 。 进 位 方式 采用 
行 波 进位 。 

先行 进位 (Carry LookAhead,CLA) 

通过 引入 进位 生成 和 进位 传递 两 个 进位 辅助 函数 ,使 得 加 法 器 的 各 个 进位 之 间 相 互 独 
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立 、 并 行 产 生 。 这 种 进位 方式 也 称 为 并 行进 位 方式 。 

成 组 先行 进位 (Block Carry LookAhead,BCLA) 

将 数据 分 成 若干 组 ,在 每 一 组 内 ,除了 并 行 生成 组 内 各 位 向 前 面 的 进位 外 ,同时 还 通过 
组 进位 生成 和 组 进位 传递 两 个 组 进位 辅助 函数 ,使 得 各 组 的 进位 也 能 相互 独立 .并行 产生 。 

先行 进位 加 法 器 (CLA adder) 

采用 先行 进位 方式 实现 的 加 法 器 ,也 称 为 并 行进 位 加 法 器 。 因 为 采用 先行 进位 方式 能 
够 快速 得 到 和 数 , 故 也 称 为 快速 加 法 器 。 

算术 逻辑 部 件 (Arithmetic Logic Unit,ALU) 

用 于 执行 各 种 基本 算术 运算 和 逻辑 运算 的 部 件 ,其 核心 部 件 是 加 法 器 ,有 两 个 操作 数 输 
入 端 和 低位 进位 输入 端 ,一 个 运算 结果 输出 端 和 若干 标志 信息 (如 零 标 志 、 洲 出 标志 等 ) 输 出 
端 。 因 为 ALU 能 进行 多 种 运算 ,因此 ,需要 通过 相应 的 操作 控制 输入 端 来 选择 进行 何 种 
运算 。 

零 标志 ZF ,溢出 标志 OF ,进位 / 借 位 标志 CF, 符 号 标志 SF 

ALU 部 件 的 输出 除了 运算 结果 外 ,还 有 一 组 状态 标志 信息 。 例 如 ,ZF(Zero Flag) 为 1 
时 表示 结果 为 0;OF(Overflow Flag ) 为 1 时 表示 结果 溢出 ;CF(Carry Flag ) 为 1 表示 在 最 高 
位 产生 了 进位 或 借 位 ;SF(Sign Flag) 和 符号 位 保持 一 致 , 若 为 1 则 表示 结果 为 负数 。 

布 斯 算法 (Booth’s algorithm) 

一 种 一 位 补 码 乘法 算法 ,用 于 带 符号 数 的 乘法 运算 ,由 布 斯 (Booth) 提 出 。 算 法 的 基本 
思想 是 : 在 乘 数 的 末 位 添加 一 个 0, 乘 数 中 出 现 的 连续 0 和 连续 1 处 不 进行 任何 运算 ;出 现 
10 时 ,做 减法 ;出 现 01 时 ,做 加 法 。 每 次 只 做 一 位 乘法 ,因而 每 一 步 都 右 移 一 位 。 

改进 布 斯 算法 (Modified Booth’s algorithm ,MBA) 

也 称 为 基 -4 布 斯 算法 ,从 布 斯 算法 推导 得 到 ,采用 两 位 一 乘 ,根据 乘 数 中 连续 三 位 的 不 
同 取 值 确定 每 一 步 相 应 的 运算 ,每 次 部 分 积 右 移 两 位 。 

对 阶 (align exponent) 

浮 点 数 加 / 减 运算 时 ,在 尾数 相 加 / 减 之 前 所 进行 的 操作 称 为 对 阶 。 对 阶 时 ,需要 比较 两 
个 阶 的 大 小 。 阶 小 的 那个 数 的 尾数 右 移 , 阶 码 增 量 。 右 移 一 次 , 阶 码 加 1, 直 到 两 数 的 阶 码 
相等 为 止 。 

溢出 (Coverflow) 

溢出 是 指 一 个 数 比 给 定 的 格式 所 能 表示 的 最 大 值 还 要 大 或 比 最 小 值 还 要 小 的 现象 。 因 
为 无 符号 数 、 带 符号 整数 和 浮 点 数 的 位 数 是 有 限 的 ,所 以 ,都 有 可 能 发 生 溢出 ,但 判断 溢出 的 
具体 方法 不 同 。 

阶 码 下 溢 (underflow) 

在 浮 点 数 运算 中 , 当 运 算 的 结果 其 指数 ( 阶 ) 比 最 小 允许 值 还 小 ,此 时 ,运算 结果 发 生 阶 
码 下 溢 , 也 即 运算 结果 的 实际 值 位 于 0 和 绝对 值 最 小 的 可 表示 数 之 间 。 通 常 机 器 会 把 阶 码 
下 溢 时 浮 点 数 的 值 置 为 0。 因此 ,这 种 情况 下 结果 并 没有 发 生 错误 ,只 是 得 到 了 一 个 近似 于 
0 的 值 ,因而 无 须 进行 溢出 处 理 。 

阶 码 上 溢 (overflow) 

在 浮 点 数 运算 中 , 当 运 算 的 结果 其 指数 ( 阶 ) 超 过 了 最 大 允许 值 时 , 浮 点 数 发 生 了 上 溢 ， 
即 向 == 方 向 溢出 。 如 果 结 果 是 正 数 , 则 发 生 正 上 滋 , 有 的 机 器 把 值 置 为 十 cc ;如 果 是 负数 , 则 
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发 生 负 上 游 ,有 的 机 器 把 值 置 为 一 2。 这 种 情况 为 软件 故障 ,通常 要 引入 溢出 故障 处 理 程序 
来 处 理 。 

规格 化 数 (normalized number) 

为 了 使 浮 点 数 能 尽量 多 地 表示 有 效 位 数 , 一 般 要 求 运算 结果 用 规格 化 数 形式 表示 。 规 
格 化 浮 点 数 的 尾数 小 数 点 后 的 第 一 位 一 定 是 非 零 数 。 因 此 ,对 于 原 码 编码 的 尾数 来 说 ,只 要 
看 尾数 的 第 一 位 是 否 为 1 就 行 ;对 于 补 码 表示 的 尾数 ,只 要 看 符号 位 和 尾数 最 高 位 是 否 
相反 。 

左 规 (left normalize) 

在 浮 点 数 运算 中 , 当 一 个 尾数 的 数值 部 分 的 高 位 出 现 0 时 ,尾数 为 非 规 格 化 形式 。 此 
时 ,进行 “ 左 规 ” 操 作 : 尾数 左 移 一 位 , 阶 码 减 1, 直 到 尾数 为 规格 化 形式 为 止 。 

右 规 (right normalize) 

在 浮 点 数 运算 中 , 当 尾 数 最 高 有 效 位 有 进位 时 ,发 生 尾 数 溢出 。 此 时 ,进行 “ 右 规 ” 操 作 ， 
尾数 右 移 一 位 , 阶 码 加 1 ,直到 尾数 为 规格 化 形式 为 止 。 右 规 过 程 中 ,要 判断 是 否 发 生 溢出 。 
此 时 ,只 要 阶 码 不 发 生 上 溢 ,那么 浮 点 数 就 不 会 溢出 。 

舍 入 (rounding) 

舍 人 是 指数 值 数据 右 部 的 低位 数据 需要 丢弃 时 ,为 保证 丢弃 后 数值 误差 尽量 小 而 考虑 
的 一 种 操作 。 例 如 ,定点 整数 “ 右 移 ” 时 , 浮 点 加 / 减 运算 中 某 数 “ 对 阶 ?时 , 浮 点 运算 结果 * 右 
规 ? 时 ,都 会 涉及 舍 人 。 

保护 位 (guard bit) 和 舍 入 位 (rounding bit) 

为 了 使 浮 点 数 的 有 效 数 据 位 在 右 移 时 最 大 限度 地 保证 不 丢失 ,一般 在 运算 过 程 中 得 到 
的 中 间 值 后 面 增加 若干 数据 位 ,这 些 位 用 来 保存 右 移 后 的 有 效 数据 ,因此 ,是 添加 的 附加 位 。 
增设 附加 位 后 ,能 保证 运算 结果 具有 一 定 的 精度 ,但 最 终 必须 将 附加 位 去 掉 ,以 得 到 规定 格 
式 的 学 点 数 ,此 时 要 考虑 合 人 。 在 IEEE 754 标准 中 规定 , 浮 点 运算 的 中 间 结 果 可 以 额外 多 
保留 两 位 附加 位 ,这 两 位 分 别称 为 保护 位 和 舍 入 位 。 

粘 位 (sticky bit) 

IEEE 754 中 规定 ,为 了 更 进一步 提高 计算 精度 ,可 以 在 舍 入 位 右边 再 增加 一 位 , 称 为 
“ 粘 位 ”只 要 舍 人 位 的 右边 还 有 任何 非 零 数 位 , 则 粘 位 为 1 ,否则 为 0。 

运算 器 (operational unit) 

即 运算 部 件 ,通常 指 用 ALU 以 及 为 了 完成 ALU 的 运算 而 必须 与 之 共同 工作 的 各 种 寄 
存 器 ,多 路 选择 器 和 实现 数据 传送 的 总 线 等 构成 的 部 件 。 根 据 功 能 不 同 有 定点 运算 器 和 浮 
点 运算 器 ,它们 是 数据 通路 中 的 核心 部 件 。 

通用 寄存 器 组 (General Register Set,GRS) 

CPU 中 提供 了 若干 个 通用 寄存 器 ,这 些 寄存 器 可 以 用 来 存放 指令 操作 的 对 象 , 需 要 在 
指令 中 明确 给 出 寄存 器 的 编号 ,所 有 通用 寄存 器 合 起 来 构成 一 个 通用 寄存 器 组 ,也 称 为 寄存 
器 堆 或 寄存 器 文件 (register file) 。 通 常 ,通用 寄存 器 组 有 两 个 读 口 和 一 个 写 口 。 

多 路 选择 器 (multiplexer) 

在 多 个 输入 数据 中 根据 控制 信号 选择 其 一 作为 输出 的 部 件 。 

桶 型 移 位 器 (barrel shifter) 

由 大 量 多 路 选择 器 实现 的 快速 移 位 器 ,可 一 次 左 移 或 右 移 多 位 ,移动 位 数 由 控制 输入 端 
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给 出 。 

Q 乘 商 寄存 器 (Q multiplier-quotient register) 

Q 乘 商 寄存 器 用 于 乘除 运算 。 在 乘法 中 该 寄存 器 用 来 存放 乘 数 ,在 除法 中 用 来 存放 
商 ,并 可 以 和 另外 的 移 位 器 共同 完成 左 移 (用 于 除法 ) 或 右 移 ( 用 于 乘法 ) 操 作 。 


3.4 常见 问题 解答 


1. 无 符号 加 法 器 如 何 实现 ? 

答 : 计算 机 中 ,最 基本 的 加 法 器 是 无 符号 加 法 器 。 根 据 进位 方式 的 不 同 , 有 三 种 不 同 的 
基本 实现 方式 。 串 行进 位 加 法 器 ( 行 波 进位 加 法 器 ): 通过 个 全 加 器 按照 串 行 方 式 连 起 来 
实现 ;进位 选择 加 法 器 : 通过 选择 两 个 分 别 带 进位 0 和 1 的 高 位 部 分 加 法 器 的 输出 来 实现 
高 、 低 两 部 分 的 并 行 执行 ;并 行进 位 加 法 器 (先行 进位 加 法 器 ) : 通过 引入 进位 生成 函数 和 进 
位 传递 函数 ,使 得 进位 之 间 相 互 独立 ,并 行 产生 。 也 称 为 快速 加 法 器 。 

2. 补 码 加 法 器 如 何 实现 ? 

答 : 两 个 n 位 补 码 进行 加 法 运算 的 规则 是 : 两 个 n 位 补 码 直 接 相 加 ,并 将 结果 中 最 高 位 
的 进位 丢掉 。 也 即 采用 模 运 算 方 式 。 显 然 ,可 用 一 个 位 无 符号 加 法 器 来 生成 各 位 的 和 。 
最 终 的 结果 是 否 正确 ,取决 于 结果 是 否 溢出 ,只 要 结果 不 溢出 , 则 结果 一 定 是 正确 的 。 因 此 ， 
补 码 加 法 器 只 要 在 无 符号 加 法 器 的 基础 上 再 增加 “溢出 判断 电路 ” 即 可 。 

3. 在 补 码 加 法 器 中 ,如 何 实现 补 码 减 法 运算 ? 

答 : 补 码 减 法 的 规则 是 : 两 个 数 差 的 补 码 可 用 第 一 个 数 的 补 码 加 上 另 一 数 负数 的 补 码 
得 到 。 由 此 可 见 , 减 法 运算 可 在 加 法 器 中 运行 。 只 要 在 加 法 器 的 第 二 个 输入 端 输入 减 数 的 
负数 的 补 码 。 求 一 个 数 的 负数 的 补 码 电 路 称 为 “负数 求 补 电路 ”。 可 以 通过 “各 位 取 反 、 末 位 
加 1” 来 实现 “负数 求 补 电 路 ”。 

4. 现代 计算 机 中 是 否 要 考虑 原 码 加 / 减 运算 ? 

答 : 因为 现代 计算 机 中 浮 点 数 采 用 IEEE 754 标准 , 浮 点 数 的 尾数 都 用 原 码 表示 ,所 以 
在 进行 两 个 浮 点 数 加 减 运 算 时 ,必须 考虑 原 码 的 加 减 运算 。 

S. 加 法 器 的 运算 速度 取决 于 什么 ? 

答 : 在 门 电路 延迟 一 定 的 情况 下 ,加 法 器 的 速度 主要 取决 于 进位 方式 ,先行 进位 方式 比 
串 行进 位 方式 的 速度 快 。 

6. 定点 整数 运算 要 考虑 加 保护 位 和 舍 入 吗 ? 

答 : 不 需要 。 整 数 运算 的 结果 还 是 整数 ,没有 误差 ,无 须 考虑 加 保护 位 ,也 无 须 考虑 舍 
入。 但 运算 结果 可 能 会 “溢出 ”。 

7. 如 何 判断 带 符号 整数 运算 结果 是 否 溢出 ? 

答 : 带 符号 整数 用 补 码 表示 ,对 于 单 符号 补 码 ( 即 2- 补 码 ) 和 双 符 号 补 码 ( 即 4- 补 码 , 变 
形 补 码 ) ,其 溢出 判断 方式 不 同 。 变 形 补 码 运算 的 溢出 判断 规则 为 “ 当 结果 的 两 个 符号 位 不 
同时 ,发 生 溢出 ”; 单 符号 补 码 运算 时 , 异 号 数 相 加 不 会 溢出 ,而 对 于 同 号 数 相 加 , 则 有 两 种 判 
断 规 则 。 规 则 1 为 “车 结果 的 符号 与 两 个 加 数 的 符号 不 同 , 则 发 生 溢 出 ”, 规 则 2 为 “车 最 高 
位 的 进位 和 次 高 位 的 进位 不 同 , 则 发 生 溢出 ”。 
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8. 在 计算 机 中 ,乘法 和 除法 运算 如 何 实 现 ? 

答 : 乘法 和 除法 运算 是 通过 加 减 运算 和 左右 移 位 运算 来 实现 的 。 只 要 用 加 法 器 和 移 
位 寄存 器 在 控制 逻辑 的 控制 下 就 可 以 实现 乘除 运算 。 也 可 用 专门 的 乘法 器 和 除法 器 实现 。 

9。 浮 点 数 如 何 进行 合 入 ? 

答 : 舍 人 方法 选择 的 原则 是 : 尽量 使 误差 范围 对 称 ,使 得 平均 误差 为 0, 即 有 舍 有 入 ， 
以 防 误差 积累 ; @ 方 法 要 简单 ,以 加 快速 度 。 

IEEE 754 有 四 种 伟人 方式 。 四 就 近 舍 人 : 舍 和 人 为 最 近 可 表示 的 数 , 若 结果 值 正好 落 在 
两 个 可 表示 数 的 中 间 , 则 一 般 选 择 舍 人 结果 为 偶数 ; @ 正 向 舍 和 人 : 朝 十 c= 方 向 舍 人 , 即 取 右 
边 的 那个 数 ; 回 负 向 伟人 : 朝 一 == 方 向 舍 人 , 即 取 左边 的 那个 数 ; 图 截 去 : 朝 0 方向 伟人 ， 
即 取 绝对 值 较 小 的 那个 数 。 

10. 在 C 语 言 程序 中 ,为 什么 以 下 程序 段 最 终 的 f 值 为 0, 而 不 是 2.5? 


float f=2.5+1lel0; 

f=f -lel0; 

答 : 首先 ,float 类 型 采用 IEEE 754 单 精度 浮 点 数 格式 表示 ,因此 ,最 多 有 24 位 二 进 制 
有 效 位 数 。 因 为 le10=10" = 二 10 X10 X10 ,在 数量 级 上 大 约 相当 于 2 X22 X22 一 23 ,而 
2.5 的 数量 级 为 2 ,因此 ,在 计算 2.5 十 le10 进行 对 阶 时 ,两 数 阶 码 的 差 为 32, 也 就 是 说 ,2.5 
的 尾数 要 向 右 移 32 位 ,从 而 使 得 24 位 有 效 数字 全 部 丢失 ,尾数 变 为 全 0, 再 与 1e10 的 尾数 
相 加 时 结果 就 是 1e10 的 尾数 ,因此 f=2.5 十 le10 的 运算 结果 仍 为 le10, 这 样 ,再 执行 {= 
{一 1el10 时 结果 就 为 0。 这 个 例子 就 是 典型 的 “大 数 吃 小 数 "的 例子 。 


3.5 单项 选择 题 

1. 8 位 无 符号 整数 1001 0101 右 移 一 位 后 的 值 为 ( )。 

A. 0100 1010 B. 0100 1011 C. 1000 1010 D. 1100 101 
2. 8 位 补 码 定点 整数 1001 0101 右 移 一 位 后 的 值 为 (  )。 

A. 0100 1010 B. 0100 1011 C. 1000 1010 D. 1100 1010 
3. 8 位 补 码 定点 整数 1001 0101 左 移 一 位 后 的 值 为 (  )。 

A. 1010 1010 B. 0010 1010 C. 0010 1011 D. 溢出 
4. 8 位 补 码 定点 整数 1001 0101 扩展 8 位 后 的 值 用 十 六 进 制 表示 为 (  )。 

A. 0095H B. 9500H C. FF95H D. 95FFH 
5. 原 码 定点 小 数 1. 1001 0101 扩展 8 位 后 的 值 为 ( )。 

A. 1.0000 0000 1001 0101 B. 1.1001 0101 0000 0000 

C. 1.1111 1111 1001 0101 D. 1. 1001 0101 1111 1111 


6. 考虑 以 下 C 语言 代码 : 
Short si=-8196; 
int i=si; 


执行 上 述 程序 段 后 ,i 的 机 器 数 表示 为 (。”)。 
A. 0000 9FFCH  B. 0000 DFFCH C. FFFF 9FFCH D. FFFF DFFCH 
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7. CPU 中 能 进行 算术 和 逻辑 运算 的 最 基本 运算 部 件 是 (。 )。 


A. 多 路 选择 器 B. 移 位 器 C. 加 法 器 D. ALU 
8. ALU 的 核心 部 件 是 (  )。 
A. 多 路 选择 器 B. 移 位 器 C. 加 法 器 D. 寄存 器 


9. 假定 表示 一 级 门 延迟 ,一 个 异 或 门 的 延迟 为 3T, 则 8 位 全 先行 进位 加 法 器 的 关键 
路 径 延 迟 为 (” )。 
A. 6T B. 8T C. 16T D. 17T 
10. 在 补 码 加 / 减 运算 部 件 中 ,无 论 采 用 双 符号 位 还 是 单 符号 位 ,必须 有 ( ) 电 路 , 它 
一 般 用 异 或 门 来 实现 。 
A. 译 码 B. 编码 C. 溢出 判断 D. 移 位 
11. 某 计 算 机 字 长 为 8 位 ,其 CPU 中 有 一 个 8 位 加 法 器 。 已 知 无 符号 数 zx 一 69,y 一 
38, 现 要 在 该 加 法 器 中 完成 x 十 y 的 运算 , 则 该 加 法 器 的 两 个 输入 端 信息 和 输入 的 低位 进位 
信息 分 别 为 ( ) 
A. 0100 0101.0010 0110 .0 B. 0100 0101 .0010 0110 1 
C. 0100 0101 .1101 1010 .0 D. 0100 0101 .1101 1010 1 
12. 某 计 算 机 字 长 为 8 位 ,其 CPU 中 有 一 个 8 位 加 法 器 。 已 知 无 符号 数 z=69,y= 
38, 现 要 在 该 加 法 器 中 完成 x 一 y 的 运算 , 则 该 加 法 器 的 两 个 输入 端 信息 和 输入 的 低位 进位 
信息 分 别 为 (  )。 
A. 0100 0101 .0010 0110 .0 B. 0100 0101.1101 1001 1 
C. 0100 0101 .1101 1010 .0 D. 0100 0101.1101 1010 1 
13. 某 计 算 机 字 长 为 8 位 ,其 CPU 中 有 一 个 8 位 加 法 器 。 已 知 带 符号 整数 z= 一 69， 
3 二 一 38, 现 要 在 该 加 法 器 中 完成 z 十 y 的 运算 , 则 该 加 法 器 的 两 个 输入 端 信息 和 输入 的 低 
位 进位 信息 分 别 为 (  )。 
A. 1011 1011.1101 1010 .0 B. 1011 1011.1101 1010 1 
C. 1011 1011.0010 0101 .0 D. 1011 1011.0010 0101 1 
14. 某 计 算 机 字 长 为 8 位 ,其 CPU 中 有 一 个 8 位 加 法 器 。 已 知 带 符 号 整数 z= 一 69， 
y 王 一 38, 现 要 在 该 加 法 器 中 完成 x 一 y 的 运算 , 则 该 加 法 器 的 两 个 输入 端 信息 和 输入 的 低 
位 进位 信息 分 别 为 (  )。 
A. 1011 1011.1101 1010 .0 B. 1011 1011.1101 1010 1 
C. 1011 1011 .0010 0101 1 D. 1011 1011.0010 0110 1 
15. 某 8 位 计算 机 中 ,假定 x 和 y 是 两 个 带 符号 整数 变量 ,用 补 码 表示 ,x==63, y= 
一 31, 则 z 十 y 的 机 器 数 及 其 相应 的 溢出 标志 OF 分 别 是 ( 汽 
A. 1FH.0 B. 20H 0 CG WH.,l1 D. 20H 1 
16. 某 8 位 计算 机 中 ,假定 zx 和 y 是 两 个 带 符号 整数 变量 ,用 补 码 表示 ,z=63,y 王 
一 31, 则 zx 一 y 的 机 器 数 及 其 相应 的 溢出 标志 OF 分 别 是 (  )。 
A. 5DH .0 B. 5EH.0 C. SDH,1 D. 5EH 1 
17. 某 8 位 计算 机 中 ,假定 带 符号 整数 变量 zx 和 > 的 机 器 数 用 补 码 表示 ,[z]j#=F5H， 
[y]#=7EH, 则 >z 十 y 的 值 及 其 相应 的 溢出 标志 OF 分 别 是 (  )。 
A. 115 .0 B. 119 .0 GC L151 D. 119 1 
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加 





[yj]# 二 7EH, 则 x 一 y 的 值 及 其 相应 的 溢出 标志 OF 分 别 是 (。”)。 


[yj# 二 DCH, 则 z 十 2y 的 机 器 数 以 及 相应 的 溢出 标志 OF 分 别 是 (。”)。 


[yj#=DCH, 则 xz 一 2y 的 机 器 数 以 及 相应 的 溢出 标志 OF 分 别 是 (。”)。 





18. 某 8 位 计算 机 中 ,假定 带 符号 整数 变量 x 和 >y 的 机 器 数 用 补 码 表示 ,[xj# 二 F5H， 


A. 115.0 B. 119.0 C. 115,1 D. 119.1 
19. 某 8 位 计算 机 中 ,假定 x 和 是 两 个 带 符号 整数 变量 ,用 补 码 表示 ,[xjJ# 二 44H， 


A. 32H.0 B. 32H.1 C. FCH.0 D; FCH,1 
20. 某 8 位 计算 机 中 ,假定 x 和 y 是 两 个 带 符号 整数 变量 ,用 补 码 表示 ,[xja 二 44H， 


A. 68H.0 B. 68H.1 C. 8CH.0 D. 8CH 1 
21. 某 8 位 计算 机 中 ,假定 x 和 y 是 两 个 带 符号 整数 变量 ,用 补 码 表示 ,[z]h 一 44H， 





[yj# 二 DCH, 则 xz/2 十 2y 的 机 器 数 以 及 相应 的 溢出 标志 OF 分 别 是 (  )。 


A. CAH,.0 B. CAH 1 C. DAH.0 D. DAH.1 
22. 假定 有 两 个 整数 用 8 位 补 码 分 别 表示 为 ,二 F5H,rs 二 EEH。 若 将 运算 结果 存放 


在 一 个 8 位 寄存 器 中 , 则 下 列 运算 中 会 发 生 溢出 的 是 ( 。”)。 


A. rir; B. ni—r; C. riXr; Dnifrs 
23. 以 下 关于 原 码 一 位 乘法 算法 要 点 的 描述 中 ,错误 的 是 (  )。 
A. 符号 位 和 数值 位 分 开 运 算 , 符 号 位 可 由 一 个 异 或 门生 成 
B. 通过 循环 执行 “加 法 ”和 *“ 移 位 ”操作 得 到 乘积 
C. ALU 中 是 否 进行 部 分 积 与 被 乘 数 的 加 法 运算 由 乘 数 最 低位 决定 
D. 移 位 时 ,将 进位 位 、 部 分 积 和 乘积 部 分 一 起 进行 算术 右 移 
24. 假定 一 次 ALU 运算 用 1 个 时 钟 周期 , 移 位 一 次 用 1 个 时 钟 周期 , 则 最 快 的 32 位 原 


码 一 位 乘法 所 需 的 时 钟 周 期 数 大 约 为 ( 。 )。 


A. 32 B. 64 C. 96 D. 100 
25， 以 下 关于 布 斯 补 码 一 位 乘法 算法 要 点 的 描述 中 ,错误 的 是 (。”)。 
A. 符号 位 和 数值 位 一 起 参加 运算 ,无 需 专门 的 符号 生成 部 件 
B. 通过 循环 执行 “加 / 减 ? 和 "* 移 位 ”操作 得 到 乘积 
C. 由 乘 数 最 低 两 位 决定 对 部 分 积 和 被 乘 数 进行 何 种 运算 
D. 移 位 时 ,将 进位 位 ,部 分 积 和 乘积 部 分 一 起 进行 算术 右 移 
26. 以 下 关于 乘法 运算 部 件 的 叙述 中 ,错误 的 是 (  )。 
A. 补 码 乘法 部 件 可 用 于 带 符号 整数 的 乘法 运算 
B. 原 码 乘法 部 件 可 用 于 浮 点 数 中 尾数 相 乘 运算 
C. 快速 阵列 乘法 器 中 的 基本 部 件 包含 移 位 器 
D. 两 位 乘法 运算 比 一 位 乘法 运算 速度 约 快 一 倍 
27. 对 于 两 个 位 无 符号 整数 除法 运算 ,以 下 关于 不 恢复 余数 算法 要 点 的 描述 中 ,错误 


的 是 ( )。 


. 起 始 时 被 除数 在 高 位 扩展 位 0, 以 将 其 扩展 为 2n 位 无 符号 整数 

. 为 判断 中 间 余 数 的 正 / 负 , 需 在 余数 寄存 器 的 最 高 位 前 增加 一 位 符号 位 
. 至 少 需 "十 1 次 循环 执行 “加 / 减 " 和 “ 左 移 ”操作 才能 得 到 位 商 

.运算 结果 一 定 不 会 发 生 溢出 , 故 无 需 通 过 得 到 最 高 位 商 来 判断 溢出 


一 
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28. 对 于 IEEE 754 单 精度 浮 点 加 减 运算 ,在 对 阶 过 程 中 , 需 计算 两 个 阶 码 E, 和 下 , 之 
差 的 补 码 [AE]#。 若 AE 之 128 或 AE 志 一 129, 则 [AEj]# 发生 溢 出 。 假定 [E, jg、 
[一 [E, jg ]# 和 [AEj# 的 最 高 有 效 位 分 别 记 为 E。E, 和 E,,, 则 相应 的 溢出 判断 方程 为 
Ct "3 

A. Overflow=E,, E,. Ev E, E,E. 
E, 





B. Overflow= 
C. Overflow=E,, E,, Ess+E,E,. E,, 
D. Overflow=E,, E,, Et.+E,, E,, E, 
29. IEEE 754 单 精度 浮 点 数 加 减 运 算 的 对 阶 过 程 中 ,需要 计算 两 个 阶 码 E, 和 EE, 之 差 
的 补 码 LAEj]#。 假 设 两 个 浮 点 数 分 别 记 为 [x]# 和 [yj#,[E,]g、LE, jg 和 [AEj]# 的 最 高 有 
效 位 分 别 记 为 E, .Ey 和 Eu , 当 [AE]# 发 生 溢出 时 ,正确 的 处 理 方式 是 ( ) 
A. 中 止 当前 程序 的 执行 , 调 出 相应 的 “溢出 ”异常 处 理 程序 执行 
B. 当 E, 为 1 时 置 最 终结 果 为 [xz]#; 当 EE 为 0 时 置 最 终结 果 为 [y ]# 
C. 当 EE, 为 1 时 置 最 终结 果 为 [x]#; 当 E,; 为 0 时 置 最 终结 果 为 [y js 
D. 当 EE, 为 0 时 置 最 终结 果 为 [x]#; 当 Es 为 1 时 置 最 终结 果 为 [y ]s 
30. 若 两 个 float 型 变量 (用 IEEE 754 单 精 度 浮 点 格式 表示 )z 和 y 的 机 器 数 分 别 表示 
为 x 二 40E8 0000H,y 二 C204 0000H, 则 在 计算 zx 十 y 时 ,第 一 步 对 阶 操作 的 结果 [AE]# 为 
¢” 先 











A. 0000 0111 B. 0000 0011 C. 1111 1011 D. 1111 1101 
31. 对 于 IEEE 754 单 精 度 浮 点 数 加 减 运算 ,只 要 对 阶 时 得 到 的 两 个 阶 码 之 差 的 绝对 值 
|AE| 大 于 等 于 ( 。 ”), 就 无 须 继续 进行 后 续 处 理 , 此 时 ,运算 结果 直接 取 阶 大 的 那个 数 。 
A. 24 B. 25 C. 126 DD: is 
32. IEEE 754 标准 提供 了 以 下 四 种 舍 入 模式 ,其 中 平均 误差 最 小 的 是 (。”)。 
A. 就 近 舍 人 (中 间 值 时 强迫 为 偶数 ) 
B. 正 向 舍 人 ( 即 朝 十 cc 方向 伟人 ) 
C. 负 向 舍 人 ( 即 朝 一 cc 方 向 伟人 ) 
D. 截断 舍 人 ( 即 朝 0 方向 伟人 ) 
【参考 答案 】 
本 :本 
全 让 13 RK WC IB 6.B 1 A 18.D 19.C 20;D 
.CC 22. CC 23.D 2 B 25. DD 26.C NC 2 而 2 B 30:D 
31. B 32. A 
【部 分 题目 的 答案 解析 】 
20. 已 知 [yj# 二 DCH 二 11011100B, 所 以 [一 yj# 二 00100100B, [zx 一 2yj# 三 [zj 十 
[一 2y]# 二 [zx] 十 [一 y] 达 过 1 二 01000100 十 00100100 达 过 1 二 01000100 十 01001000= 
10001100 二 8CH, 从 最 后 一 步 加 操作 来 看 ,是 两 个 正 数 相 加 ,结果 为 负数 , 故 溢出 标志 OF 为 
1。 综 上 所 述 ,答案 为 D。 
21. [z/2 十 2y =[z]j#s>>1+[y]#<<1=01000100>>1+11011100<<1= 
00100010 十 10111000=11011010=DAH, 从 最 后 一 步 加 操作 来 看 ,是 一 个 正 数 和 一 个 负数 
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相 加 ,因此 一 定 不 会 液 出 。 综 上 所 述 ,答案 为 C。 

23. 关于 原 码 一 位 乘法 算法 要 点 的 描述 中 ,错误 的 是 D 选项 中 的 说 法 :“ 移 位 时 ,将 进 
位 位 部 分 积 和 乘积 部 分 一 起 进行 算术 右 移 ”"。 因 为 原 码 一 位 乘法 算法 中 ,数值 部 分 和 符号 
分 开 处 理 , 数 值 部 分 通过 无 符号 乘 的 算法 实现 ,在 将 进位 位 、 部 分 积 和 乘积 部 分 右 移 时 ,采用 
的 是 逮 辑 右 移 , 即 高 位 补 0 的 办 法 ,而 不 是 采用 算术 右 移 方式 。 

24. 假定 一 次 ALU 运算 用 1 个 时 钟 周期 , 移 位 一 次 用 1 个 时 钟 周期 , 则 最 快 的 32 位 原 
码 一 位 乘法 所 需 的 时 钟 周期 数 大 约 为 64。 因 为 32 位 原 码 一 位 乘法 的 循环 次 数 为 32 ,每 次 
循环 中 ,控制 逻辑 根据 当前 乘 数 寄存 器 的 最 低位 确定 是 否 在 ALU 中 进行 加 法 运算 ,这 需要 
一 个 时 钟 周期 ;然后 进行 右 移 操作 ,这 需要 一 个 时 钟 周期 。 因 此 ,每 次 循环 需要 两 个 时 钟 周 
期 ,一共 需要 大 约 64 个 时 钟 周期 。 

25. 关于 布 斯 补 码 一 位 乘法 算法 要 点 的 描述 中 ,错误 的 是 D 选项 中 的 说 法 :“ 移 位 时 ， 
将 进位 位 ,部 分 积 和 乘积 部 分 一 起 进行 算术 右 移 ”。 因 为 补 码 一 位 乘法 的 算法 中 ,并 没有 专 
门 的 进位 位 ,而 符号 位 作为 部 分 积 的 一 部 分 进行 处 理 , 所 以 ,选项 D 的 描述 中 提 到 进位 位 和 
部 分 积 、 乘 积 部 分 一 起 算术 右 移 是 错误 的 。 

27. 对 于 两 个 ”位 无 符号 整数 除法 运算 ,最 大 的 商 为 111…11/000…01=111…11, 显 
然 ,运算 结果 没有 产生 溢出 。 因 此 ,两 个 ”位 无 符号 整数 除法 运算 肯定 不 会 溢出 ,无 需 通过 
得 到 最 高 位 商 (第 位 商 gq,) 来 判断 溢出 ,也 即 只 要 有 次 循环 执行 “加 / 减 " 和 “ 左 移 ” 操 作 ， 
就 能 得 到 第 "一 1~0 位 的 位 商 (g,_1~gqo)。 因 此 ,选项 C 的 说 法 是 错误 的 。 

28. 对 于 IEEE 754 单 精度 浮 点 加 减 运算 ,在 对 阶 过 程 中 , 需 计 算 两 个 阶 码 E, 入, 之 
差 的 补 码 LAEJ# ,LAE]# 二 [E, 一 E,j# =[E, js 十 [一 LE,jsj#。 假 定 [E, js、[ 一 LE, Js ja 
和 [AE]# 的 最 高 有 效 位 分 别 记 为 Es 、E,s 和 Eu , 若 AE 之 128, 则 [LAE]# 发 生 正 溢出 ,此 时 
Ew 为 1, 而 EE, 一 定 为 正 数 , 即 E 二 1, 区, 一定 为 负数 , 即 [E,] 移 的 符号 位 为 0, 计算 
[一 [E,jg ]# 时 ,对 [E,]g 的 各 位 取 反 , 末 位 加 1, 从 而 得 到 E,,= 二 1, 综 合 起 来 的 刻 辑 表达 式 
就 是 FE Ew; 车 AE< 一 129, 则 [AEj]# 发 生 负 溢 出 ,此 时 Es 为 0, 而 EE, 一定 为 负数 , 即 
EE, 二 0,E, 一 定 为 正 数 , 即 [E, jg 的 符号 位 为 1, 计 算 [ 一 [E, ]g ] 久 时 ,对 [E, jg 的 各 位 取 反 、 
末 位 加 1, 从 而 得 到 E, 二 0, 综 合 起 来 的 迎 辑 表达 式 就 是 E Ey Er, 因此 ,Overflow = 
EB, BE 五 Es 

29. 假设 浮 点 数 zx 和 y 的 机 器 数 分 别 记 为 [zj]# 和 [yj]s,[AE]# = 二 [EE,j]#= 
[Ej 十 [一 LE,j8 Jj， 将 LE, jg 、LE, jg 和 [AEj]# 的 最 高 有 效 位 分 别 记 为 FE 和 E,,。 当 
[AE]# 发 生 溢出 时 , 若 AE 之 128, 说 明 xz 的 阶 比 y 的 阶 至 少 大 128,y 的 尾数 至 少 要 向 右 移 
28 位 ,因而 y 被 x“ 吃 掉 ”, 结 果 应 该 取 z, 此 时 EE 二 1; 若 AE< 一 129, 说 明 y 的 阶 比 x 的 阶 
至 少 大 129,z 的 尾数 至 少 要 向 右 移 129 位 ,因而 zx 被 y* 吃 掉 ”, 结 果 应 该 取 y, 此 时 E,, 二 0。 
因此 ,选项 了 是 正确 的 。 

30. x 和 y 的 机 器 数 分 别 表示 为 =40E8 0000H 二 0100 0000 1…,y 王 C204 0000H= 
100 0010 0…, 因 此 ,[E,j8 =1000 0001,[E,j]g8=1000 0100,[AE]# 三 [一 已, 一 
[E,]#+[—[LE,J$j#=1000 0001 十 0111 1100=1111 1101。 

31. 对 于 IEEE 754 单 精 度 浮 点 数 加 减 运算 , 若 对 阶 时 得 到 的 两 个 阶 码 之 差 的 绝对 值 
AE| 等 于 24, 则 说 明 阶 小 的 那个 数 的 尾数 右 移 24 位 ,进行 尾数 加 减 运算 时 ,虽然 其 结果 的 
前 24 位 直接 取 阶 大 的 那个 数 的 相应 位 ,但 是 ,由 于 可 以 保留 附加 位 , 阶 小 的 那个 数 右 移 后 的 
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尾数 可 能 会 在 舍 人 时 向 前 面 一 位 进 1。 例 如 ,1.00*…01X2: 十 1.10*…00X2-3==1.00*…01X 
2! 十 0.00…0011X2! 二 1.00…0111X2!。 其 中 ,加 粗 的 两 位 为 保留 的 附加 位 ,最 终 需 要 根据 
这 两 位 进行 伟人 ,显然 , 舍 人 后 的 结果 为 1. 00…10X21 ,并 不 等 于 阶 大 的 那个 数 。 若 |AE| 等 
于 25, 则 保留 的 附加 位 中 ,最 左边 第 1 位 一 定 是 0, 采 用 就 近 舍 人 时 ,这 些 附 加 位 完全 被 丢 
弃 。 因 此 ,|AE| 大 于 等 于 25 时 ,可 以 使 运算 结果 直接 取 阶 大 的 那个 数 。 


3.6 分 析 应 用 题 


1. 考虑 下 列 C 语言 程序 代码 : 


int i=65535; 
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short si= (short)i; 

int j=si; 

假定 上 述 程序 段 在 某 32 位 机 器 上 执行 ,sizeof(int) = 二 4, 则 变量 i、si 和 j 的 值 分 别 是 多 
少 ? 为 什么 ? 

【分 析 解 答 】 

一 台 32 位 机 器 上 执行 上 述 代 码 段 时 ,i 为 32 位 补 码 表示 的 定点 整数 ,第 2 行 要 求 强 
行将 一 个 32 位 带 符号 数 截断 为 16 位 带 符号 整数 ,65535 的 32 位 补 码 表 示 为 0000 FFFFH， 
截断 为 16 位 后 变 成 FFFFH, 它 是 一 1 的 16 位 补 码 表示 ,因此 si 的 值 是 一 1。 再 将 该 16 位 
带 符号 整数 扩展 为 32 位 时 ,就 变 成 了 FFFF FFFFH, 它 是 一 1 的 32 位 补 码 表示 ,因此 j 的 
值 也 为 一 1。 也 就 是 说 ,i 的 值 原来 为 65535, 经 过 截断 .再 扩展 后 ,其 值 变 成 了 一 1。 

2. 考虑 以 下 C 语言 程序 代码 ， 
int funcl(unsigned word) 
{ 


return (int) ((word <<24)>>24) 7 


} 


int func2 (unsigned word) 
{ 
return( (int)word <<24)>>24; 
} 
假设 在 一 个 32 位 机 器 上 执行 这 些 函 数 ,sizeof(int) ==4, 说 明 函数 funcl 和 func2 的 功 
能 ,并 填写 表 3.1, 给 出 对 表 中 “异常 "数据 的 说 明 。 
表 3.1 题 2 用 表 
w funcl(w) func2(w) 


机 器 数 值 机 器 数 值 机 器 数 值 
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funcl(w) 


func2(w) 


续 表 





机 器 数 


机 器 数 


机 器 数 











【分 析 解 答 】 














函数 funcl 的 功能 是 把 无 符号 数 高 24 位 清 零 ( 左 移 24 位 再 逻辑 右 移 24 位 ) ,结果 一 定 
是 正 的 带 符号 整数 ;而 函数 func2 的 功能 是 把 无 符号 数 的 高 24 位 都 变 成 和 第 25 位 一 样 , 因 
为 左 移 24 位 后 左边 第 一 位 变 为 原来 的 第 25 位 ,然后 进行 算术 右 移 ,高 位 补 符号 , 即 高 24 位 


都 变 成 和 原来 第 25 位 相同 。 


根据 程序 执行 的 结果 填写 表 3. 2, 表 中 机 器 数 用 十 六 进 制 表示 。 


表 3.2 题 2 中 填 入 结果 后 的 表 


























Ww funcl(w) func2(w) 

机 器 数 值 机 器 数 值 机 器 数 值 
0000007FH 127 0000007FH 十 127 0000007FH 十 127 
00000080H 128 00000080H 十 128 FFFFFF80H 一 128 
000000FFH 255 000000FFH 十 255 FFFFFFFFH 
00000100H 256 00000000H 0 00000000H 0 








因为 好 辑 左 移 和 算术 左 移 的 结果 完全 相同 ,所 以 ,函数 funcl 和 func2 中 第 一 步 左 移 
24 位 得 到 的 结果 完全 相同 ,所 不 同 的 是 右 移 24 位 后 的 结果 不 同 。 

表 3.2 中 ,加 粗 数据 是 一 些 * 异 常 ? 结 果 。 当 w=128 和 255 时 ,第 25 位 正好 是 1, 因 此 
函数 func2 执行 的 结果 为 一 个 负数 ,出现 了 * 蜡 常 *>。 当 w=256 时 , 低 8 位 为 00, 高 24 位 为 
非 0 值 , 左 移 24 位 后 使 得 有 效 数字 被 移出 ,因而 发 生 了 “溢出 ”, 使 得 出 现 了 “异常 "结果 0。 

3， 以 下 是 两 段 C 语 言 代码 ,函数 arith() 是 直接 用 C 语 言 写 的 ,而 optarith() 是 对 arith() 函 
数 以 某 个 确定 的 M 和 N 编译 生成 的 机 器 代码 反 编 译 生成 的 。 根 据 optarith() ,可 以 推断 函 
数 arith() 中 M 和 NN 的 值 各 是 多 少 ? 


#define M 
#define N 


int arith (int x, int y) 


{ 


int result=0; 


result=x* M+y/N; 


return result; 


int optarith (int x, int y) 


{ 


运算 方法 和 运算 部 件 


int t=zx; 

和 <<=47 

了 -= 七 7 

if(y<0) y+=3; 
Y>>=27 
return X+Y7 


} 


【分 析 解 答 】 

对 反 编 译 结果 进行 分 析 可 知 : 对 于 x, 指令 机 器 代码 中 有 一 条 “x 左 移 4 位 ”指令 , 即 x= 
16x, 然 后 有 一 条 “减法 ”指令 , 即 x=16x 一 x 二 15x, 根 据 源 程序 知 M=15; 对 于 y, 有 一 条 “y 
右 移 2 位 ?指令 , 即 y=y/4, 根 据 源 程序 知 N=4。 但 是 , 当 y<0 时 ,对 于 有 些 y, 执 行 y 之 之 2 
后 的 值 并 不 等 于 y/4。 例 如 , 当 y= 一 1 时 ,在 反 编译 函数 optarith() 中 执行 y> 之 之 2 时 ,因为 
一 1 的 机 器 数 为 全 1, 左 移 两 位 后 还 是 全 1, 也 即 一 1 之 之 2 三 一 1, 结 果 为 一 1; 而 原 函 数 arith() 中 
执行 y/4 时 ,因为 一 1/4=0, 得 到 结果 为 0。 

对 于 带 符号 整数 来 说 ,采用 算术 右 移 时 ,高 位 补 符号 ,低位 移出 。 因 此 , 当 符号 位 为 0 
时 ,与 无 符号 整数 相同 ,采用 移 位 方式 和 直接 相 除 得 到 的 商 完 全 一 样 。 当 符号 位 为 1 时 , 若 
低位 移出 的 是 非 全 0, 则 说 明 不 能 整除 。 例 如 ,对 于 一 3/2, 假 定 补 码 位 数 为 4, 则 进行 算术 右 
移 操作 1101 之 >1=1110. 1B( 小 数 点 后 面部 分 移出 ) 后 得 到 的 商 为 一 2, 而 精确 商 是 一 1. 5， 
即 整数 商 应 为 一 1。 显 然 ,算术 右 移 后 得 到 的 商 比 精确 商 少 了 0. 5, 相 当 于 朝 一 == 方 向 进行 
了 伟人 ,而 不 是 朝 零 方向 舍 人 。 因 此 ,这 种 情况 下 , 移 位 得 到 的 商 与 直接 相 除 得 到 的 商 不 一 
样 ,需要 进行 校正 。 

校正 的 方法 是 对 于 带 符号 整数 x, 若 x<0, 则 在 右 移 前 , 先 将 x 加 上 偏 移 量 (2* 一 1), 然 
后 再 右 移 k 位 。 例 如 ,上 述 函 数 optarith 中 ,在 执行 y 之 之 2 之 前 加 了 一 条 语句 “if(y<0)y 十 
二 3;”, 以 对 y 进行 校正 。 

4. 设 A,~Al 和 Bi~B, 分 别 是 4 位 加 法 器 的 两 组 输入 ,C, 为 低位 来 的 进位 。 当 加 法 
器 分 别 采用 串 行 进位 和 先行 进位 时 , 写 出 4 个 进位 C,~Ci 的 逮 辑 表达 式 。 

【分 析 解 答 】 

串 行 进位 : C= 二 AiC, 十 BiCo 十 A1B 

C:=A:Ci 十 BC 十 4:B， 
CG;=AsCs+ BC+ AsB; 
C=ACst+BC+AB, 
并 行进 位 ; C==AiBi 十 (Ai 十 Bi)C。 
C:=A;B: 十 (A: 十 B,)A,B, 十 (A; 十 B)(A 十 BC 
C:=A;B, 十 (A; 十 B;,)A;B, 十 (A; 十 B:,)(A; 十 B:,)A,B， 
+(As+Bs)(As+B,) (Ait+Bi)C, 
Ci=A,B, 十 (A, 十 B,)A;B; 十 (A, 十 B,)(A; 十 B,)A;B， 
十 (A, 十 B,)(A;: 十 B,)(A; 十 B,)A; B， 
十 (A, 十 B,)(A: 十 B:)(A: 十 B,)(A 十 BC 
5. 某 字 长 为 8 位 的 计算 机 中 ,x 和 >y 为 无 符号 整数 ,已 知 z=68,y=80,z 和 y 分 别 存 
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放 在 寄存 器 A 和 B 中 。 请 回答 下 列 问 题 (要 求 最 终 用 十 六 进 制 表示 二 进 制 序列 )。 

(1) 寄存 器 A 和 B 中 的 内 容 分 别 是 什么 ? 

(2) 车 zx 和 y 相 加 后 的 结果 存放 在 寄存 器 C 中 , 则 寄存 器 C 中 的 内 容 是 什么 ? 运算 结 
果 是 否 正 确 ? 加 法 器 最 高 位 的 进位 Cout 是 什么 ? 零 标志 ZF 和 进位 标志 CF 各 是 什么 ? 

(3) 若 zx 和 >y 相 减 后 的 结果 存放 在 寄存 器 D 中 , 则 寄存 器 D 中 的 内 容 是 什么 ?运算 结 
果 是 否 正 确 ? 加 法 器 最 高 位 的 进位 Cout 是 什么 ? 零 标志 ZF 和 借 位 标志 CF 各 是 什么 ? 

(4) 无 符号 整数 加 / 减 运算 时 ,加 法 器 最 高 位 进位 Cout 的 含义 是 什么 ? 它 与 进 / 借 位 标 
志 CF 的 关系 是 什么 ? 

(5) 无 符号 整数 一 般 用 来 表示 什么 信息 ?为 什么 通常 不 对 无 符号 整数 的 运算 结果 判断 
溢出 ? 

【分 析 解 答 】 

(1) x=68 二 0100 0100B==44H;y==80==0101 0000B=50H。 所 以 ,寄存 器 A 和 B 中 的 
内 容 分 别 是 44H 和 50H。 

(2) zx 十 y= 二 0100 0100 十 0101 0000=(0)1001 0100=94H ,所 以 ,寄存 器 C 中 的 内 容 为 
94 理 ,对 应 的 真 值 为 148, 运 算 结 果 正 确 。 加 法 器 最 高 位 的 进位 Cout 为 0。 因 为 结果 不 为 0， 
所 以 ZF=0; 进 位 标志 CF 二 Cout==0。 

(3) x 一 y= 二 xz 十 [一 yj# 二 0100 0100 十 1011 0000=(0)1111 0100=F4H, 所 以 ,寄存 器 D 
中 的 内 容 为 F4H, 对 应 的 真 值 为 244, 运 算 结 果 不 正确 ,这 是 因为 相 减 结果 为 负数 造成 的 。 
加 法 器 最 高 位 的 进位 Cout 为 0。 因 为 结果 不 为 0, 所 以 ZF=0; 借 位 标志 为 CF= Cout @ 
1=1。 

(4) 在 加 法 器 中 进行 无 符号 整数 加 法 运算 时 , 若 加 法 器 最 高 位 进位 Cout=1, 则 表示 实 
际 结果 大 于 最 大 可 表示 数 255; 在 加 法 器 中 进行 无 符号 整数 减法 运算 时 , 若 加 法 器 最 高 位 进 
位 Cout=1, 则 表示 被 减 数 大 于 减 数 ,反之 被 减 数 小 于 减 数 。 因 此 ,在 无 符号 数 相 加 时 ,CF 
就 等 于 Cout ,表示 进 位 ;在 无 符号 数 相 减 时 ,通常 将 最 高 进位 Cout 取 反 来 作为 借 位 标志 
CF, 也 即 ,无 符号 整数 相 减 时 ,CF=Cout,CF=1 表示 有 借 位 。 

(5) 无 符号 整数 一 般 用 来 表示 地 址 (指针 ) 信 息 , 当 两 个 地 址 相 加 结果 大 于 最 大 地 址 而 
取 低 位 地 址 时 ,相当 于 取 模 ,也 即 采 用 地 址 循环 运算 。 因 此 通常 不 需要 判断 其 运算 结果 是 否 
溢出 , 即 不 考虑 溢出 标志 OF 。 

6. 假设 某 字 长 为 8 位 的 计算 机 中 , 带 符号 整数 采用 补 码 表 示 ,z= 一 68,y= 一 80,z 和 y 
分 别 存放 在 寄存 器 A 和 B 中 。 请 回答 下 列 问 题 (要 求 最 终 用 十 六 进 制 表示 二 进 制 序列 )。 

(1) 寄存 器 A 和 B 中 的 内 容 分 别 是 什么 ? 

(2) 车 x 和 y 相 加 后 的 结果 存放 在 寄存 器 C 中 , 则 寄存 器 C 中 的 内 容 是 什么 ? 运算 结 
果 是 否 正确 ? 加 法 器 最 高 位 的 进位 Cout 是 什么 ? 溢出 标志 OF ,符号 标志 SF 和 零 标志 ZF 
各 是 什么 ? 

(3) 若 z 和 y 相 减 后 的 结果 存放 在 寄存 器 D 中 , 则 寄存 器 D 中 的 内 容 是 什么 ? 运算 结 
果 是 否 正确 ?此 时 ,加 法 器 最 高 位 的 进位 Cout 是 什么 ?溢出 标志 OF ,符号 标志 SF 和 有 零 标 
志 ZF 各 是 什么 ? 

(4) 对 于 带 符号 整数 的 减法 运算 ,能 否 直接 根据 CF 的 值 对 两 个 带 符 号 整数 的 大 小 进行 
比较 ? 
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【分 析 解 答 】 

(1) [—68]# =[—1000100]#=1011 1100B=BCH,. [—80]#=[—1010000]#=1011 
0000B 二 BOH。 所 以 ,寄存 器 A 和 B 中 的 内 容 分 别 是 BCH 和 BOH。 

(2) [z 十 yj# 王 [zj 十 [Ly]#=1011 1100B 十 1011 0000B==(1)0110 1100B=6CH ,最 高 
位 前 面 的 一 位 1 被 丢弃 ,因此 ,寄存 器 C 中 的 内 容 为 6CH, 对 应 的 真 值 为 十 108, 结 果 不 正 
确 。 加 法 器 最 高 位 向 前 面 的 进位 Cout 为 1。 溢出 标志 位 OF 可 采用 以 下 任意 一 条 规则 判断 
得 到 。 规 则 1: 若 两 个 加 数 的 符号 位 相同 ,但 与 结果 的 符号 位 相 异 , 则 溢出 ;规则 2: 若 最 高 
位 上 的 进位 和 次 高 位 上 的 进位 不 同 , 则 溢出 。 对 于 本 题 ,通过 这 两 个 规则 都 判断 出 结果 洲 
出 ,因此 溢出 标志 OF 为 1, 说 明 寄 存 器 C 中 的 内 容 不 是 正确 的 结果 。z 十 y 的 正确 结果 应 是 
一 68 十 (一 80) 二 一 148, 而 运算 的 结果 为 108, 两 者 不 等 。 其 原因 是 因为 x 十 y 的 值 ( 即 
一 148) 小 于 8 位 补 码 可 表示 的 最 小 值 ( 即 一 128) ,也 即 结果 发 生 了 溢出 ;结果 的 第 一 位 (最 高 
位 )0 为 符号 标志 位 SF, 即 SF=0, 表 示 结 果 为 正 数 ;因为 结果 不 为 0, 所 以 零 标志 ZF=0。 

(3) [zx 一 yj] 三 [zj 十 [一 yj 二 1011 1100B 十 0101 0000B==(1)0000 1100B=0CH, 最 
高 位 前 面 的 一 位 1 被 丢弃 ,因此 ,寄存 器 D 中 的 内 容 为 0CH, 对 应 的 真 值 为 十 12, 结 果 正 确 。 
加 法 器 最 高 位 向 前 面 的 进位 Cout 为 1。 两 个 加 数 的 符号 位 相 异 一 定 不 会 洲 出 ,因此 溢出 标 

志 OF==0, 说 明 寄存 器 D 中 的 内 容 是 真正 的 结果 ;结果 的 第 一 位 (最 高 位 )0 为 符号 标志 位 
SF, 即 SF=0, 表 示 结 果 为 正 数 ;因为 结果 不 为 0, 所 以 零 标 志 ZF=0。 

(4) 对 于 带 符 号 整数 的 减法 运算 ,无 法 直接 根据 CF 的 值 判断 两 个 带 符号 整数 的 大 小 。 
例如 ,对 于 xz= 一 68,y=80,[z 一 yy 三 [z]# 十 [一 =1011 1100B 十 1011 0000B=(1) 
0110 1100B, 得 到 的 Cout 为 1, 因此 ,CEF=Cout @ 1=0, 表 示 没 有 借 位 ,推断 出 被 减 数 应 该 
大 于 减 数 , 即 一 68 之 80, 显 然 这 是 不 正确 的 。 因 此 带 符号 运算 中 不 考虑 CF 标志 。 

7. 某 计 算 机 标志 寄存 器 包含 4 个 标志 位 : CF 一 进 / 借 位 标志 ;OF 一 溢出 标志 ;SF 一 符 
号 标志 ;ZF 一 零 标志 。 请 说 明 在 无 符号 数 和 带 符号 整数 两 种 情况 下 ,以 下 各 种 比较 运算 的 逻 
辑 判断 表达 式 。 

(1) 等 于 ; (2) 大 于 ; (3) 小 于 ; (4) 大 于 等 于 ; (5) 小 于 等 于 。 

【分 析 解 答 】 

要 比较 两 个 数 的 大 小 ,通常 对 这 两 个 数 先 做 减法 ,根据 相 减 的 结果 生成 相应 的 标志 位 ， 
最 后 根据 标志 位 判断 大 小 。 在 无 符号 数 相 减 时 ,一 般 不 考虑 SF 和 OF 标志 ;在 带 符号 整数 
相 减 时 ,一 般 不 考虑 CF 标志 。 

假设 被 减 数 的 机 器 数 为 X, 减 数 的 机 器 数 为 Y, 则 在 加 法 器 中 计算 两 数 的 差 时 ,计算 公 
式 为 X 一 了 =X 十 (一 了 )#。 以 下 举 两 个 例子 来 说 明 。 

假定 X=1001,Y 二 1100, 则 在 4 位 加 法 器 中 执行 以 下 运算 : 1001 一 1100=1001 十 
0100=(0)1101。 若 是 无 符号 数 比较 , 则 是 9 和 12 相 比 ,显然 ,ZF=0,CF=1; 若 是 带 符号 整 
数 ( 补 码 表示 ), 则 是 一 7 和 一 4 比较 ,显然 ,ZF=0,OF=0,SF=1。 

假定 X 王 1001,Y 王 0100, 则 在 4 位 加 法 器 中 执行 以 下 运算 : 1001 一 0100 王 1001 十 
1100=(1)0101。 若 是 无 符号 数 比 较 , 则 是 9 和 4 相 比 ,显然 ,ZF 二 0,CF==0; 若 是 带 符号 整 
数 , 则 是 一 7 和 4 比较 ,显然 ,ZF=0,OF=1,SF=0。 

以 下 分 别 说 明 无 符号 数 和 带 符 号 整数 两 种 情况 下 各 种 比较 运算 的 逻辑 判断 表达 式 。 

在 无 符号 数 情况 下 : 


















































第 
3 
章 





计算 机 组 成 与 系统 结 欧 习题 解答 和 我 学 指 时 (第 2 版 ) 





(1) 等 于 : 相 减 后 结果 为 0, 即 F=ZF。 

(2) 大 于 : 没有 借 位 且 相 减 后 不 为 0, 即 F=CF .ZF=CF 十 ZF。 

(3) 小 于 : 有 借 位 且 相 减 后 不 为 0, 即 F=CF ， ZF。 

(4) 大 于 等 于 : 没有 借 位 或 相 减 后 结果 为 0, 即 F=CF 十 ZF。 

(5) 小 于 等 于 : 有 借 位 或 相 减 后 结果 为 0, 即 F 一 CF 十 ZF。 

在 带 符号 整数 情况 下 : 

(1) 等 于 : 相 减 后 结果 为 0, 即 F=ZF。 

(2) 大 于 : 结果 不 为 0, 且 不 溢出 时 为 正 , 溢 出 时 为 负 。 即 F=ZF (SF OF)。 

(3) 小 于 : 结果 不 为 0, 且 不 溢出 时 为 负 , 溢 出 时 为 正 。 即 F=ZF* (SF @ OF)。 

(4) 大 于 等 于 : 结果 为 0, 或 者 不 溢出 时 为 正 ,溢出 时 为 负 。 即 F=ZF 十 (SF 加 OF)。 

(5) 小 于 等 于 : 结果 为 0, 或 者 不 溢出 时 为 负 , 溢 出 时 为 正 。 即 F=ZF 十 (SF @ OF)。 

可 以 对 照 上 述 判断 表达 式 ,验证 上 述 例子 。 无 符号 整数 9 和 12 是 小 于 关系 , 相 减 后 得 
到 的 标志 ZF=0,CF=1, 故 F=CF。ZF=1。 无 符号 整数 9 和 4 是 大 于 关系 , 相 减 后 得 到 的 
标志 CF=0,ZF=0, 故 =CF，2ZF= 二 1。 带 符号 整数 一 7 和 一 4 是 小 于 关系 , 相 减 后 得 到 的 
标志 ZF=0,OF=0,SF=1, 故 f=ZF，(SF @ OF)==1。 带 符号 整数 一 7 和 4 是 小 于 关系 ， 
相 减 后 得 到 的 标志 ZF=0,OF=1,SF=0, 故 F=ZF* (SF @ OF)=1。 

8. 填写 表 3. 3, 注 意 对 比 无 符号 数 和 带 符号 整数 的 乘法 结果 ,以 及 截断 操作 前 后 的 



























































表 3.3 题 8 用 表 
必 y ZzXy( 截 断 前 ) ZXy( 截 断后 ) 
模 式 
机 器 数 值 机 器 数 值 机 器 数 值 机 器 数 值 
无 符号 数 110 010 
二 进 制 补 码 | ”110 010 
无 符号 数 001 111 
二 进 制 补 码 | ”001 111 
无 符号 数 111 111 
二 进 制 补 码 | 111 111 
【分 析 解 答 】 


根据 无 符号 数 乘法 运算 和 补 码 乘法 运算 算法 ,填写 表 3.4。 
表 3.4 题 8 中 填 入 结果 后 的 表 











六 y ZzXy( 截 断 前 ) ZzXy( 截 断后 ) 

en 机 器 数 值 机 器 数 值 机 器 数 值 机 器 数 值 
无 符号 数 110 6 010 2 001100 12 100 4 
二 进 制 补 码 | ”110 = 010 +2 111100 —4 100 一 4 
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续 表 

过 y ZzXy( 截 断 前 ) ZzXy( 截 断后 ) 

0 机 器 数 值 机 器 数 值 机 器 数 值 机 器 数 值 
无 符号 数 001 1 111 7 000111 7 111 名 
二 进 制 补 码 | ”001 十 1 111 一 1 lil | 1 111 一 1 

无 符号 数 111 i 111 7 110001 49 001 1 
二 进 制 补 码 | ”111 二 111 二 000001 | 十 1 001 十 1 


























对 表 3.4 中 结果 分 析 如 下 ， 

(1) 对 于 两 个 相同 的 机 器 数 , 作 为 无 符号 数 进 行 乘法 运算 和 作为 带 符号 整数 进行 乘法 
运算 ,因为 其 所 用 的 乘法 算法 不 同 , 所 以 ,乘积 的 机 器 数 可 能 不 同 。 但 是 ,从 表 中 看 出 ,截断 
后 的 乘积 是 一 样 的 ,也 即 不 同 的 仅 是 乘积 中 的 高 位 ,而 低位 完全 一 样 。 

(2) 对 于 ”位 乘法 运算 ,无论 是 无 符号 数 乘法 还 是 带 符号 整数 乘法 , 若 截取 2n 位 乘积 
的 低 n 位 作为 最 终 的 乘积 , 则 都 有 可 能 结果 溢出 , 即 n 位 数字 无 法 表示 正确 的 乘积 。 虽然 表 
中 给 出 的 带 符号 整数 乘积 截断 后 都 没有 发 生 溢出 ,但 实际 上 还 是 存在 溢出 的 情况 ,例如 ， 
011X011=001001 ,截断 后 011X011=001, 显 然 截 断后 的 结果 发 生 了 溢出 。 

(3) 表 中 加 粗 的 地 方 是 截断 后 发 生 溢出 的 情况 。 可 以 看 出 ,对 于 无 符号 整数 乘法 , 若 乘 
积 中 高 n 位 为 全 0, 则 截断 后 的 低位 乘积 不 发 生 溢出 ,否则 溢出 ;对 于 带 符号 整数 乘法 , 若 
高 n 位 中 的 每 一 位 都 等 于 低 n 位 中 的 第 一 位 , 则 截断 后 的 低 n 位 乘积 不 发 生 溢出 ,否则 
溢出 。 

9. 考虑 以 下 C 语言 程序 代码 ， 

int funcl(unsigned short si) 

{ 

Feturn(six 256); 


} 


int func2(unsigned short si) 
{ 

return (si/256); 
| 


int func3(unsigned short si) 
{ 
return(((short)six* 256)/256); 


int func4 (unsigned short si) 
{ 

return (short) ((six 256) /256); 
人 
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请 回答 下 列 问 题 : 
(1) 假设 计算 机 硬件 不 提供 乘除 运算 功能 ,能 否 用 移 位 运算 实现 上 述 函 数 功能 ? 函数 
funcl .func2 ,func3 和 func4 得 到 的 结果 各 有 什么 特征 ? 
(2) 填写 表 3. 5( 要 求 机 器 数 用 十 六 进 制 表示 ) ,并 对 表 中 的 “异常 "数据 进行 分 析 。 
表 3.5 题 9 用 表 
si funcl (si) func2(si) func3(si) func4 (si) 
机 器 数 | 值 | 机 器 数 | 值 | 机 器 数 | 值 | 机 器 数 | 值 | 机 器 数 值 
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65 535 


(3) 对 于 函数 funcl 来 说 ,用 一 位 乘 运算 所 花 的 时 间 开 销 大 约 是 用 移 位 运算 的 多 少 倍 ? 
对 于 函数 func2 来 说 ,用 不 恢复 余数 除法 所 花 的 开销 大 约 是 用 移 位 运算 的 多 少 倍 ? 

【分 析 解 答 】 

(1) 编译 器 在 处 理 变量 与 常数 相 乘 时 ,往往 以 移 位 .加 法 和 减法 的 组 合 运算 来 代替 乘法 
运算 。 例 如 ,对 于 表达 式 x * 20, 编 译 器 可 以 利用 20=16 十 4 一 2 十 22 ,将 xx 20 转换 为 
(x<<4) 十 (x<<2) ,这 样 ,一 次 乘法 转换 成 了 两 次 移 位 和 一 次 加 法 。 不 管 是 无 符号 整数 
还 是 带 符号 整数 的 乘法 ,即使 乘积 溢出 时 ,利用 移 位 和 加 减 运算 组 合 的 方式 得 到 的 结果 都 是 
和 采用 直接 相 乘 的 结果 是 一 样 的 。 

为 了 缩短 除法 运算 的 时 间 ,编译 器 在 处 理 一 个 变量 与 一 个 2 的 寡 次 形式 的 整数 相 除 时 ， 
常 采 用 右 移 运算 来 实现 。 无 符号 整数 除法 采用 逻辑 右 移 方式 , 带 符号 整数 除法 采用 算术 右 
移 方式 。 两 个 整数 相 除 ,结果 也 一 定 是 整数 ,在 不 能 整除 时 ,其 商 采用 朝 零 方向 舍 人 的 方式 ， 
也 就 是 截断 方式 ,即将 小 数 点 后 的 数 直接 去 掉 , 例 如 ,7/3=2, 一 7/3== 一 2。 

对 于 无 符号 整数 来 说 ,采用 逻辑 右 移 时 ,高 位 补 0, 低 位 移出 ,因此 , 移 位 后 得 到 的 商 的 
值 只 可 能 变 小 而 不 会 变 大 , 即 商 朝 零 方 向 舍 入 。 因 此 ,不 管 是 否 能 够 整除 ,采用 移 位 方式 和 
直接 相 除 得 到 的 商 完全 一 样 。 但 是 ,对 于 带 符号 整数 x 来 说 ,如 题 3 的 分 析 解 答 中 所 说 的 那 
样 , 当 计算 z/2 时 ,车 z+ 过 0, 则 不 能 直接 将 x 算术 右 移 k 位 ,而 应 该 先 将 x 加 上 偏 移 量 
(2* 一 1) ,然后 再 算术 右 移 人 位 。 

因为 256 一 2 ,所 以 题目 给 出 的 函数 中 的 乘 、 除 运算 可 以 分 别 用 左 、 右 移 运算 来 实现 。 
可 用 “ 左 移 8 位” 代替“ 乘 256” 的 操作 ,用 * 右 移 8 位 ”代替 “ 除 以 256” 的 操作 。funcl(si) 相 
当 于 将 si 逻辑 左 移 8 位 ,结果 的 最 后 8 位 都 为 0;func2(si) 相 当 于 将 si 逻辑 右 移 8 位 ,结果 
的 范围 在 0 一 255 之 间 ;func3(si) 相 当 于 将 si 先 算 术 左 移 8 位 ,再 算术 右 移 8 位 ,所 以 结果 
的 范围 在 一 128 一 127 之 间 ;func4(si) 相 当 于 将 si 先 逻 辑 左 移 8 位 ,再 逻辑 右 移 8 位 ,最 后 以 
带 符号 整数 类 型 返回 ,因为 最 后 是 逻辑 右 移 ,高 位 补 0, 所 以 ,返回 的 总 是 正 数 ,结果 的 范围 
在 0~255 之 间 。 

(2) 函数 funcl ,func2 func3 和 func4 的 执行 结果 如 表 3.6 所 示 。 
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表 3.6 题 9 中 填 入 结果 后 的 表 

si funcl (si) func2(si) func3(si) func4(si) 章 
机 器 数 值 机 器 数 值 机 器 数 值 机 器 数 值 机 器 数 值 
007FH 127 | 7FooH | 32512 | 0000H 0 | 007FH 127 | 007FH | 127 
0080H 128 | 8000H | 32768 | 0000H 0 | FF80H | —128 | 0080H | 128 
00FFH 255 | FFOOH | 65280 | 0000H 0 | FFFFH —1 | OOFFH | 255 
0100H 256 | 0000H 0 | o001H 1 | 0000H 0 | 0000H 0 
FFFFH | 65535 | FFOOH | 65280 | O00FFH | 255 | FFFFH —1 | O00FFH | 255 





























表 3.6 中 ,加 粗 数据 是 一 些 * 异 常 ”结果 。 当 si 二 256 时 ,由 于 256X si 二 65536, 因 此 用 
16 位 无 符号 数 无 法 表示 实际 结果 ,导致 funcl(si) ,func3(si) 和 func4 (si) 都 为 0; 当 si= 
65535 时 ,由 于 256 Xsi 溢出 ,导致 funcl func3 和 func4 的 函数 值 出 现 了 “异常 "结果 ; 当 
si 二 128 时 ,因为 256X128=32768, 超 过 了 short 型 数据 的 最 大 表示 范围 ,发 生 溢出 ,其 结果 
与 128 达 <8 的 操作 结果 一 样 ,机 器 数 都 是 8000H, 其 真正 的 值 为 一 32768, 再 除 以 256, 结 果 
为 一 128, 与 对 8000H 算术 右 移 8 位 得 到 的 结果 FF80H( 值 为 一 128) 完 全 一 样 ; 当 si 一 255 
时 ,因为 256X255 二 65280, 超 过 了 short 型 数据 的 最 大 表示 范围 ,发 生 溢出 。 因 此 , 左 移 
16 位 后 得 到 乘积 FF00H( 真 值 为 一 256) ,其 第 一 位 (符号 位 ) 为 1, 即 乘积 变 成 了 负数 ,反映 
出 乘积 是 一 个 溢出 值 。 因 此 再 除 以 256 ,结果 应 该 是 一 1, 显 然 ,通过 算术 右 移 8 位 得 到 的 结 
果 FFFFH, 其 值 也 是 一 1。 

(3) 用 移 位 操作 代替 乘除 运算 ,其 程序 执行 时 间 会 大 大 减少 。 采 用 桶 型 移 位 器 进行 移 
位 时 ,移动 任何 位 数 都 只 要 一 次 移 位 操作 。 假 定 一 次 移 位 操作 所 用 时 间 和 一 次 加 / 减 运算 时 
间 一 样 ,都 是 一 个 时 钟 周 期 ,那么 ,对 于 函数 funcl ,采用 一 位 乘法 器 时 ,两 个 16 位 数 相 乘 
的 运算 所 需 循 环 次 数 为 16, 每 个 循环 内 进行 “判断 一 加 法 一 右 移 ” 操 作 , 其 中 判断 操作 是 控 
制 器 在 送出 控制 信号 之 前 进行 的 ,无 需 一 个 专门 的 时 钟 周期 来 实现 ,因此 16 位 乘法 运算 所 
用 时 间 大 约 为 32T, 由 此 可 知 ,采用 一 位 乘法 运算 ,函数 funcl 的 执行 时 间 是 采用 移 位 运算 
的 32 倍 左右 。 对 于 函数 func2, 采 用 不 恢复 余数 法 时 ,两 个 16 位 数 相 除 时 所 需 循环 次 数 为 
16 ,循环 内 有 “判断 一 左 移 (上 商 ) 一 加 / 减 ? 操 作 , 所 用 时 间 大 约 为 32T, 因 此 是 采用 移 位 运算 
的 32 倍 左右 。 

10. 若 一 次 加 法 需要 lns, 一 次 移 位 需要 0. 5ns。 请 分 别 估算 用 一 位 乘法 ,两 位 乘法 、 基 
于 CRA 的 阵列 乘法 、 基 于 CSA 的 阵列 乘法 4 种 方式 计算 两 个 8 位 无 符号 二 进 制 数 乘积 时 
所 需 的 时 间 。 

【分 析 解 答 】 

对 于 8 位 无 符号 二 进 制 数 相 乘 ,一 位 乘法 需 8 次 右 移 ,8 次 加 法 ,共计 12ns; 二 位 乘法 需 
4 次 右 移 ,4 次 加 法 ,共计 6ns; 对 于 基于 CRA 的 阵列 乘法 ,每 一 级 部 分 积 不 仅 依赖 于 上 一 级 
部 分 积 , 还 依赖 于 上 一 级 最 终 的 进位 ,而 每 一 级 进位 又 是 串 行进 行 的 ,所 以 最 长 的 路 径 总 共 
经 过 了 8 十 2X (8 一 1) 二 22 个 单元 节点 (细胞 模块 ) ,假定 经 过 每 个 单元 节点 所 花 时 间 平 均 为 
0. 5ns, 则 共计 大 约 11ns; 对 于 基于 CSA 的 阵列 乘法 ,本 级 进位 与 本 级 和 能 同时 传送 到 下 一 
级 , 且 同 级 部 分 积 之 间 互 不 依赖 ,因此 只 需 进行 O(N) 次 简单 加 法 ( 即 半 加 或 全 加 ) 运 算 , 假 
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定 简单 加 法 时 间 为 8 位 加 法 器 时 间 的 一 半 , 则 一 共 大 约 为 4ns。 

11. 已 知 z=10,y 一 一 6, 采 用 6 位 机 器 数 表示 。 请 按 如 下 要 求 计算 , 并 把 结果 还 原 成 
真 值 。 

(1) 求 [x 十 y]#4,[z 一 yj] 。 

(2) 用 原 码 一 位 乘法 计算 [x X yjs。 

(3) 用 补 码 一 位 乘法 ( 布 斯 算法 ) 计 算 [zXy]#。 

(4) 用 MBA( 基 4 布 斯 ) 乘 法 计算 [zXy]#。 

(5) 用 不 恢复 余数 法 计算 [zx/yj] 和 的 商 和 余数 。 

【分 析 解 答 】 

先 将 x 和 y 转换 为 二 进 制 数 。zx==10= 十 01010B,y= 一 6 二 一 00110B。 

(1) [z]# =0 01010B, [yj# =1 11010B,[—yj# =0 00110B。 [zx 二 yj]#=[zj# 十 
[y]#=0 01010B 十 1 11010B==0 00100B, 因 此 ,zx 十 y= 二 4。[z 一 y] 和 三 [zx] 十 [一 yj 
0 01010B 十 0 00110B=0 10000B, 因 此 ,zx 一 y= 十 16。 

(2) [zjm=0 01010B,[yjm 二 1 00110B。 将 符号 和 数值 部 分 分 开 处 理 。 乘 积 的 符号 为 
0 田 1=1, 数 值 部 分 采用 无 符号 数 乘法 算法 计算 01010X00110 的 乘积 。 原 码 一 位 乘法 过 程 
描述 如 下 : 初始 部 分 积 为 0, 在 乘积 寄存 器 前 增加 一 个 进位 位 。 每 次 循环 首先 根据 乘 数 寄存 
器 中 最 低位 决定 十 X 还 是 十 0, 然 后 将 得 到 的 新 进位 、 新 部 分 积 和 乘 数 寄存 器 中 的 部 分 乘 数 
一 起 泌 辑 右 移 一 位 。 共 循环 5 次 ,最 终 得 到 一 个 10 位 无 符号 数 表示 的 乘积 00001 11100B。 
所 以 ,[xX yj 二 1 00001 11100B, 因 此 ,zXy= 一 60。 若 结果 取 6 位 原 码 , 则 因为 高 5 位 
00001 是 一 个 非 0 数 ,所 以 ,结果 溢出 , 即 LzXyJj 夫 1 11100。 验 证 : 6 位 原 码 的 表示 范围 为 
一 31 一 十 31, 显 然 乘积 一 60 不 在 其 范围 内 ,结果 应 该 溢出 。( 过 程 略 ) 

(3) [z]#=0 01010B,[ 一 z]#=1 10110B,[y]#=1 11010B。 采 用 布 斯 算法 时 ,符号 和 
数值 部 分 一 起 参加 运算 ,最 初 在 乘 数 后 面 添 0, 初 始 部 分 积 为 0。 每 次 循环 先 根据 乘积 寄存 
器 中 最 低 两 位 决定 执行 十 X、 一 X 还 是 十 0 操作 ,然后 将 得 到 的 新 的 部 分 积 和 乘 数 寄存 器 中 
的 部 分 乘 数 一 起 算术 右 移 一 位 。 一 X 用 十 [一 z]# 实 现 。 共 循环 6 次 。 最 终 得 到 一 个 12 位 
补 码 表示 的 乘积 111111 000100B, 所 以 ,[zXyj# 二 111111 000100B, 因 此 ,zxXy= 一 60。 若 
结果 取 6 位 补 码 , 则 根据 乘积 低 6 位 000100 的 符号 位 为 0, 而 高 6 位 为 111111, 不 等 于 全 0， 
说 明 结 果 溢 出 , 即 [zXyj# 冯 0 00100。 验 证 : 6 位 补 码 的 表示 范围 为 一 ?2 一 十 31, 显 然 乘 积 
一 60 不 在 其 范围 内 ,结果 应 该 溢出 。( 过 程 略 ) 

(4) [zj 一 0 01010B,[ 一 zj 二 1 10110B,[yj]# 二 1 11010B。 采 用 MBA 算法 时 ,符号 
和 数值 部 分 一 起 参加 运算 ,最 初 在 乘 数 后 面 添 0, 初 始 部 分 积 为 0, 并 在 部 分 积 前 加 一 位 符号 
位 0。 每 次 循环 先 根据 乘积 寄存 器 中 最 低 3 位 决定 执行 十 X、 十 2X、 一 XX、 一 2X、 还 是 十 0 操 
作 , 然 后 将 得 到 的 新 的 部 分 积 和 乘 数 寄存 器 中 的 部 分 乘 数 一 起 算术 右 移 两 位 。 一 X 和 一 2X 
分 别 采用 十 [一 +]# 和 十 2[ 一 zj]# 的 方式 进行 。 共 循环 3 次 。 最 终 得 到 一 个 12 位 补 码 表示 
的 乘积 1111 1100 0100B, 所 以 ,[zXyj# 二 1111 1100 0100B, 因 此 ,xXy= 一 60。( 过 程 略 ) 

(5) [xz] 和 二 0 01010B,[yj] 和 三 1 00110B。 将 符号 和 数值 部 分 分 开 处 理 。 商 的 符号 为 
0 田 1=1, 数 值 部 分 采用 无 符号 数 除法 算法 计算 01010B 和 00110B 的 商 和 余数 。 无 符号 数 
不 恢复 余数 除法 过 程 描述 如 下 : 初始 中 间 余 数 为 0 00000 01010 0, 其 中 ,最 高 位 为 添加 的 符 
号 位 ,用 于 判断 余数 是 否 大 于 等 于 0; 最 后 一 位 0 为 第 一 次 上 的 商 , 该 位 商 只 是 用 于 判断 结 
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果 是 否 溢出 ,不 包含 在 最 终 的 商 中 。 因 为 结果 肯定 不 溢出 ,所 以 该 位 商 可 以 直接 上 0, 并 先 
做 一 次 一 Y 操作 得 到 第 一 次 中 间 余数 ,然后 进入 循环 。 每 次 循环 首先 将 中 间 余 数 和 商 一 起 
左 移 一 位 ,然后 根据 上 一 次 上 的 商 (或 余数 的 符号 ) 决 定 执行 十 Y 还 是 一 Y 操作 ,以 得 到 新 的 
中 间 余 数 , 最 后 根据 中 间 余 数 的 符号 确定 上 商 为 0 还 是 1。 一 了 采用 十 [一 yj]# 的 方式 进行 。 
整个 循环 内 执行 的 要 点 是 “ 正 、1\ 减 ; 负 、0、 加 ”。 共 循环 5 次 。 最 终 得 到 一 个 6 位 无 符号 数 
表示 的 商 000001 和 余数 00100, 其 中 第 一 位 商 0 必须 去 掉 , 添 上 符号 位 后 得 到 最 终 的 商 的 
原 码 表示 为 1 00001, 余 数 的 原 码 表示 为 00100。 因 此 ,x/y 的 商 为 一 1 ,余数 为 4。( 过 程 略 ) 

12. 假设 浮 点 数 的 阶 码 和 尾数 均 采 用 补 码 表示 , 且 位 数 分 别 为 5 位 和 7 位 ( 均 含 2 位 符 
号 位 , 即 变形 补 码 )。 若 有 两 个 数 久 二 27 X15/16,Y = 二 25 X 3/8, 要 求 用 浮 点 加 法 计算 X 十 Y 
的 最 终结 果 是 什么 ? 

【分 析 解 答 】 

先 将 两 个 数 的 尾数 部 分 变 成 分 母 为 32 的 形式 , 即 X=2? X30/32,Y 二 2 X12/32,X 和 
了 转换 成 题 设 的 浮 点 数 格式 ,X: 00. 11110, 00111;Y: 00. 01100,00101, 然 后 进行 浮 点 数 
加 / 减 运算 。Y 对 阶 后 为 00. 00011, 00111 ,因此 尾数 相 加 结果 为 00. 11110 十 00. 00011= 
01. 00001 ,该 尾数 形式 需要 右 规 , 即 尾数 右 移 一 位 , 若 采 用 ”0 舍 1 和 人?” 舍 人 法 , 右 规 后 尾数 为 
00. 10001, 阶 码 加 1 后 为 01000, 因 此 , 右 规 后 为 00. 10001, 01000, 最 后 要 对 该 结果 进行 液 
出 判断 。 显 然 , 阶 码 的 两 个 符号 位 不 同 , 故 结果 溢出 。 

13. 假设 有 两 个 实数 x 和 y ,z= 一 68,y== 一 8.25, 它 们 在 C 语言 程序 中 定义 为 float 型 
变量 (用 IEEE 754 单 精度 浮 点 数 格式 表示 ) ,x 和 y 分 别 存放 在 寄存 器 A 和 了 中 。 另 外 ,还 
有 两 个 寄存 器 C 和 DD。A、B.C.D 都 是 32 位 寄存 器 。 请 回答 下 列 问题 (要 求 最 终 用 十 六 进 
制 表示 二 进 制 序列 )。 

(1) 寄存 器 A 和 B 中 的 内 容 分 别 是 什么 ? 

(2) 若 z 和 > 相 加 后 的 结果 存放 在 寄存 器 C 中 , 则 寄存 器 C 中 的 内 容 是 什么 ? 

(3) 若 zx 和 y 相 减 后 的 结果 存放 在 寄存 器 D 中 , 则 寄存 器 D 中 的 内 容 是 什么 ? 

【分 析 解 答 】 

(1) x= 一 68== 一 100 0100B= 一 1. 0001BX2 ,因此 ,符号 位 为 1, 阶 码 为 1000 0101B， 
尾数 小 数 部 分 为 000 1000 0000 0000 0000 0000B, 浮 点 数 表示 形式 为 1 1000 0101 000 1000 
0000 0000 0000 0000, 十 六 进 制 形式 为 C288 0000H。y 8. 25 1000. 01B 
一 1. 00001BX2: ,因此 ,符号 位 为 1, 阶 码 为 1000 0010B, 尾 数 小 数 部 分 为 000 0100 0000 
0000 0000 0000B, 浮 点 数 表 示 形 式 为 1 1000 0010 000 0100 0000 0000 0000 0000 ,十 六 进 制 
形式 为 C104 0000H。 因 此 ,寄存 器 A 和 B 中 的 内 容 分 别 是 C288 0000H、C104 0000H。 

(2) 两 个 浮 点 数 相 加 的 步骤 如 下 。 

Q@ 对 阶 。 

[E, jg =1000 0101,[E, jg =1000 0010,[AE]# 一 [一 已 一 [E。] 基 十 [一 LE] Ja 
1000 0101 十 0111 1110=0000 0011,E. 一 忆 ,= 十 3,E. 大 于 EE,, 所 以 对 y 进行 对 阶 。 对 阶 
后 ,y 二 一 0. 00100001 X25。 即 y 的 浮 点 表示 为 1 1000 0101(0) 001 0000 1000 0000 
0000 0000。 

@ 尾数 相 加 。 

工 的 尾数 为 一 1. 000 1000 0000 0000 0000 0000,y 的 尾数 为 一 0. 001 0000 1000 0000 
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0000 0000。 原 码 加 法 运算 规则 为 “ 同 号 求 和 , 异 号 求 差 *。 因 两 数 符号 相同 , 故 做 加 法 ,结果 
为 一 1.001 1000 1000 0000 0000 0000。 因 此 ,z 十 y 的 结果 为 一 1.001 1000 1X2s ,符号 位 为 
1 ,尾数 为 001 1000 1000 0000 0000 0000 , 阶 码 为 127 十 6 二 128 十 5 二 1000 0101B, 浮 点 数 表 
示 为 1 1000 0101 001 1000 1000 0000 0000 0000 ,转换 为 十 六 进 制 形式 为 C298 8000H。 因 
此 ,寄存 器 C 中 的 内 容 是 C298 8000H。 

(3) 两 个 浮 点 数 相 减 的 步骤 同 加 法 ,对 阶 的 结果 也 一 样 ,只 是 尾数 相 减 。 原 码 减法 运算 
规则 为 “ 同 号 求 差 , 异 号 求 和 ”。 因 两 数 符号 相同 , 故 做 减法 。 数 值 部 分 由 被 减 数 加 上 减 数 的 
补 码 ( 各 位 取 反 ,末尾 加 1) 得 到 , 即 : 

1. 000 1000 0000 0000 0000 0000 

十 )1.110 1111 1000 0000 0000 0000 

1 0.111 0111 1000 0000 0000 0000 
最 高 数值 位 产生 进位 ,表明 所 得 数值 位 正确 , 且 结 果 的 符号 取 被 减 数 的 符号 , 即 结果 为 负数 。 
因此 ,z 减 y 的 结果 为 一 0.11101111X2== 一 1.1101111X25。 也 即 符号 位 为 1 ,尾数 为 110 
1111 0000 0000 0000 0000, 阶 码 为 127 十 5 王 128 十 4 一 1000 0100B, 浮 点 数 表示 为 1 1000 
0100 110 1111 0000 0000 0000 0000, 转 换 为 十 六 进 制 形式 为 C26F 0000H。 因 此 ,寄存 器 D 

中 的 内 容 是 C26F 0000H。 

14. 在 IEEE 754 浮 点 数 运算 中 , 当 结 果 的 尾数 出 现 什么 形式 时 需要 进行 左 规 ” 什 么 形 
式 时 需要 进行 右 规 ? 如 何 进行 左 规 ? 如 何 进行 右 规 ? 

【分 析 解 答 】 

(1) 对 于 结果 为 土 1 X. X X…X 的 情况 ,需要 进行 右 规 。 即 尾数 右 移 一 位 , 阶 码 加 1。 
右 规 操作 可 以 表示 为 : MAM X2- ,EE 十 1。 右 规 时 注意 以 下 两 点 ; 尾数 右 移 时 ， 
最 高 位 1 被 移 到 小 数 点 前 一 位 作为 隐藏 位 ,最 后 一 位 移出 时 ,要 考虑 舍 人 ; @ 阶 码 加 1 时， 
直接 在 末 位 加 1。 

(2) 对 于 结果 为 士 0.00…01X… 共 的 情况 ,需要 进行 左 规 。 即 数值 位 逐次 左 移 , 阶 码 逐 
次 减 1 ,直到 将 第 一 位 1 移 到 小 数 点 左边 。 假 定 上 为 结果 中 * 士 > 和 左边 第 一 个 1 之 间 连 续 0 
的 个 数 , 则 左 规 操 作 可 以 表示 为 : M < 一 M, X2:,E,<-E, 一 k。 左 规 时 注意 以 下 两 点 :; 尾数 
左 移 时 数值 部 分 最 左 & 个 0 被 移出 ,因此 ,相对 来 说 ,小 数 点 右 移 了 A 位 。 因 为 进行 尾数 相 
加 时 ,默认 小 数 点 位 置 在 第 一 个 数值 位 ( 即 隐藏 位 ) 之 后 ,所 以 小 数 点 右 移 k 位 后 被 移 到 了 第 
一 位 1 后 面 ,这 个 1 就 是 隐藏 位 ; @ 执 行 E, 一 E, 一 k 时 ,每 次 都 在 末 位 减 1, 一 共 减 人 次 。 

15. 在 IEEE 754 浮 点 数 运算 中 ,如 何 判断 浮 点 运算 的 结果 是 否 溢出 ? 

【分 析 解 答 】 

浮 点 运算 结果 是 否 溢出 ,并 不 以 尾数 溢出 来 判断 ,而 主要 看 阶 码 是 否 溢出 。 尾 数 溢出 
时 ,可 通过 右 规 操作 进行 纠正 。 因 为 在 进行 规格 化 .尾数 伟人 和 浮 点 数 的 乘 / 除 运算 过 程 中 ， 
都 需要 对 阶 码 进行 加 \ 减 运算 ,因此 在 这 些 操作 过 程 中 ,可 能 会 发 生 阶 码 上 浇 或 阶 码 下 滋 。 
阶 码 上 洪 时 ,说 明 结果 的 数值 太 大 ,无 法 表示 ,是 真正 的 溢出 ; 阶 码 下 浇 时 ,说 明 结果 数值 太 
小 ,可 以 把 结果 近似 为 0。 

16. 假设 浮 点 数 格式 为 : 阶 码 是 4 位 移 码 , 偏 置 常数 为 8, 尾 数 是 6 位 补 码 ( 采 用 双 符 号 
位 ), 用 浮 点 运算 规则 分 别 计算 在 不 采用 任何 附加 位 和 采用 2 位 附加 位 (保护 位 、 舍 人 位 ) 的 
情况 下 以 下 各 式 的 值 (假定 对 阶 和 右 规 时 采用 就 近 舍 入 到 偶数 方式 ) 。 
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第 
(1) (15/16)X27 十 (2/16)X25 (2) (15/16)X27 一 (2/16)X25 3 
(3) (15/16)X25 十 (2/16)X27 (4) (15/16)X25 一 (2/16)X27 人 

章 
【分 析 解 答 】 





将 上 述 各 式 中 的 数据 用 相应 的 变量 A.B.C、D 代替 。 

A=(15/16)X2=0., 1111BX?";[Al]s=00. 1111; 1111, 

B=(2/16) X25=0.0010BX25=0.1000BX23,[B]a=00.1000, 1011。 

C=(15/16) X25=0.1111BX2;,[C]# =00. 1111, 1101, 

D=(2/16) X2'=0.0010BX2’=0. 1000BX25,[D]#=00.1000, 1101。 

不 采用 任何 附加 位 时 的 计算 结果 如 下 。 

(1) 计算 A 十 B: [AE]#=[Eaj# 十 [一 [Es jgj# 二 1111 十 0101==0100(mod 24) ,因此 
AE 二 4, 故 需 对 B 进行 对 阶 ,因为 采用 就 近 舍 和 人 到 偶数 方式 ,所 以 ,B 的 尾数 右 移 4 位 后 直接 
会 去 1000, 又 因为 1000 是 中 间 值 ,因此 尾数 取 偶 数 00. 0000, 故 对 阶 后 结果 为 [Bj 一 
00.0000, 1111。 由 于 B 的 尾数 为 0, 因 此 ,[A 十 B]# 二 [A]# 二 00.1111, 1111。 故 A 十 B= 
A=(15/16)X27 。 

(2) 计算 A 一 B: 对 阶 结果 与 (1) 相 同 , 故 [A 一 BJ# 二 [Aj]# 二 00.1111, 1111。 故 A 一 
B=A=(15/16) X2’。 

(3) 计算 C+D: [AE]#==[Ecj8 十 [一 [Epj8j# 二 1101 十 0011==0000(mod 24) ,因此 
AE=0, 故 无 须 对 阶 。 尾 数 直接 加 : [Mc j# 十 [Mp]# 二 00.1111 十 00.1000 二 01. 0111, 因 为 
补 码 的 两 个 符号 位 不 同 ,所 以 尾数 溢出 ,需要 右 规 。 右 规 时 需 对 尾数 进行 合 入 , 阶 码 加 1。 
舍 人 最 后 一 位 的 1 是 中 间 值 ,因此 尾数 取 偶 数 00. 1100, 阶 码 1101 加 1 后 为 1110, 所 以 ， 
[C+D]js =00.1100, 1110。 故 C 十 D=(12/16)X2。 

(4) 计算 C 一 D: 对 阶 结果 与 (3 相同。 尾数 直接 减 : [Mc ja 十 [一 Mp]# 二 00.1111 十 
11. 1000=00.0111。 显 然 ,尾数 需 左 规 。 左 规 时 ,尾数 左 移 一 位 , 阶 码 减 1。 因 此 ,最 终 尾 数 
为 00.1110, 阶 码 1101 减 1 后 为 1100。 因 此 ,[C 一 Dj]js 王 00.1110，1100, 故 C 一 D=(14/ 
0 

采用 两 位 附加 位 时 的 计算 结果 如 下 。 

(1) 计算 A 十 B: [AE]#==[Eaj$ 十 [一 [Esj$j# 二 1111 十 0101==0100(mod 24) ,因此 
AE 二 4, 故 需 对 B 进行 对 阶 ,对 阶 后 结果 为 [Bja 二 00.0000 10, 1111。 尾 数 相 加 结果 为 : 
[Ma ja +[LMs ja =00.1111 00 十 00. 0000 10=00. 1111 10, 因 此 ,[A+B]#=00. 1111 10， 
1111。 最 后 对 尾数 附加 位 10 进行 舍 入 ,因为 舍 入 的 是 中 间 值 ,所 以 尾数 结果 强迫 为 偶数 , 即 
尾数 末 位 加 1, 得 尾数 为 01.0000, 因 此 ,尾数 需 右 规 为 00. 1000, 同 时 , 阶 码 1111 加 1, 产 生 
阶 码 上 洲 , 因 而 导致 结果 溢出 。 因 此 ,A 十 B 的 结果 溢出 。 

(2) 计算 A 一 B: 对 阶 结果 与 (1) 相 同 ,尾数 相 减 结果 为 : [Ma j# 十 [一 Ms ja 二 
00.1111 00 十 11.1111 10=00. 1110 10, 因 此 ,[A 一 Bjs 二 00. 1110 10, 1111。 最 后 对 尾数 
附加 位 10 进行 会 入 ,因为 会 入 的 是 中 间 值 ,所 以 尾数 结果 强迫 为 偶数 ,得 尾数 为 00. 1110， 
因此 ,[A 一 Bj# 二 00.1110, 1111。 故 A 一 B=(14/16) X2’。 

(3) 计算 C 十 D: [AE]#==[Ecj$ 十 [一 [Ep]$j# 二 1101 十 0011 二 0000(mod 24) ,因此 
AE==0, 故 无 须 对 阶 。 尾 数 直 接 加 : [Mc ja 十 [Mp]# 二 00.1111 00 十 00. 1000 00=01. 0111 
00, 因 为 补 码 的 两 个 符号 位 不 同 ,所 以 尾数 溢出 ,需要 右 规 。 右 规 时 需 对 尾数 进行 舍 入 , 阶 码 









































计算 机 组 成 与 系统 结 榴 习题 解答 和 教学 指导 (第 2 版) 





加 1。 侈 人 的 100 是 中 间 值 ,因此 尾数 取 偶数 00. 1100, 阶 码 1101 加 1 后 为 1110, 所 以 ， 
[C 二 DJ]# =00.1100,，1110。 故 CD=(12/16)X25。 

(4) 计算 C 一 D: 对 阶 结果 与 (3) 相 同 , 尾 数 直接 减 : LMc]# 十 [一 Mo]# 王 00.1111 00 十 
11. 1000 00 二 00.0111 00。 显 然 ,尾数 需 左 规 。 左 规 时 ,尾数 左 移 一 位 , 阶 码 减 1。 因 此 ,最 
终 尾数 为 00.1110, 阶 码 1101 减 1 后 为 1100。 因 此 ,[C 一 D]# 王 00.1110, 1100, 故 C 一 D= 
(14/16)X24。 

17. 采用 IEEE 754 单 精度 浮 点 数 格式 计算 下 列表 达 式 的 值 。 

(C1) 0,75+(—65. 25》 (2) 0.75—(—65. 25) 

【分 析 解 答 】 

z=0.75=0.11B=(1. 10…0)。 X271,y=—65.25=—1000001.01B= (一 1. 00000101 
…0),。X 25。 用 IEEE 754 标准 单 精度 格式 表示 为 [xj]a 二 0 01111110 10…0,[y]# = 
1 10000101 000001010…0。 假 定 用 E;, 、E, 分 别 表 示 [z]z 和 [yj]# 中 的 阶 码 ,M,、M, 分 别 表 
示 [z]# 和 [yj# 中 的 尾数 , 即 E,=0111 1110,M,=0(1).10*…0,E,=1000 0101,M,=1(1). 
000001010…0。 尾 数 M, 和 M, 的 小 数 点 前 面 有 两 位 ,第 一 位 为 数 符 , 第 二 位 加 了 括号 ,是 
隐藏 位 1。 以 下 是 机 器 中 浮 点 数 加 / 减 运算 过 程 (假定 保留 2 位 附加 位 : 保护 位 和 伟人 位 ) 。 

(1) 0.75 十 (一 65. 25) 的 运算 过 程 如 下 。 

Q@ 对 阶 。 

[AE]# =E:+[—E, j=0111 1110 二 0111 1011=1111 1001(mod 2:),AE= 一 7, 故 需 
对 xz 进行 对 阶 ,结果 为 E,==E, 二 1000 0101,M, 二 00.000000110…0 00, 即 将 xz 的 尾数 Mz 
右 移 7 位 ,符号 不 变 ,数值 高 位 补 0, 隐 藏 位 右 移 到 小 数 点 后 面 ,最 后 移出 的 2 位 保留 。 

@ 尾数 相 加 。 

Mi =M, 十 M,=00.000000110…0 00 十 11. 000001010…0 00( 注 意 小 数 点 在 隐藏 位 后 ) 。 
根据 原 码 加 /减法 运算 规则 ,得 : 00. 000000110…0 00 十 11. 000001010…0 00=11. 000。 
000100…0 00。 上 式 尾 数 中 最 左边 第 一 位 是 符号 位 ,其 余 都 是 数值 部 分 ,尾数 后 面 两 位 是 附 
加 位 (加 粗 ) 。 

@ 规格 化 。 

根据 所 得 尾数 的 形式 ,数值 部 分 最 高 位 为 1 ,所 以 不 需要 进行 规格 化 。 

@ 舍 人。 

将 结果 的 尾数 M, 中 最 后 两 位 附加 位 舍 人 ,从 本 例 来 看 ,不 管 采用 什么 舍 人 法 ,结果 都 
一 样 ,都 是 把 最 后 两 个 0 去 掉 , 得 : M,=11.000000100…0。 

Q@ 溢出 判断 。 

在 上 述 阶 码 计算 和 调整 过 程 中 ,没有 发 生 * 阶 码 上 溢 ” 和 ”* 阶 码 下 溢 ? 的 问题 。 

最 终结 果 为 E, = 二 1000 0101,M =1(1). 00000010…0, 即 ; (一 1. 0000001), X 25 一 
一 64.5。 

(2) 0.75 一 (一 65. 25) 的 运算 过 程 如 下 。 

@ 对 阶 。 

同上 述 (1) 中 对 阶 过 程 一 样 。 

@ 尾数 相 减 。 

Ms 二 M; 一 M, 二 00.000000110…0 00 一 11. 000001010…0 00, 根 据 原 码 加 /减法 运算 规 
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则 ,得 : 00.000000110…0 00 一 11.000001010…0 00==01. 00001000…0 00。 上 式 尾数 中 最 
左边 第 一 位 是 符号 位 ,其 余 都 是 数值 部 分 ,尾数 后 面 两 位 是 附加 位 (加 粗 ) 。 

@ 规格 化 。 

根据 所 得 尾数 的 形式 ,数值 部 分 最 高 位 为 1 ,不 需要 进行 规格 化 。 

Q@ 伟人 。 

把 结果 的 尾数 M, 中 最 后 两 位 附加 位 舍 人 ,得 : M, 二 01.00001000…0。 

@ 溢出 判断 。 

在 上 述 阶 码 计算 和 调整 过 程 中 ,没有 发 生 * 阶 码 上 溢 ” 和 * 阶 码 下 滋 ” 的 问题 。 

最 后 结果 为 E, 二 1000 0101,M 二 0(1).00001000…0, 即 : (十 1.00001)s X25 二 十 66。 

18. 假定 十 进 制 数 用 8421 NBCD 码 表 示 , 采 用 十 进 制 加 法 运算 计算 下 列表 达 式 的 值 ， 
并 讨论 在 十 进 制 BCD 码 加 法 运算 中 如 何 判断 溢出 。 

(1) 234 十 567 (2) 548 十 729 

【分 析 解 答 】 

(1) 计算 234 十 567 时 ,两 个 加 数 分 别 是 0010 0011 0100 和 0101 0110 0111 , 送 到 12 位 
无 符号 加 法 器 中 得 到 和 为 0111 1001 1011, 其 中 ,最 低 4 位 需 进行 “十 6” 校 正 ,得 到 12 位 结 
果 为 0111 1010 0001, 此 时 ,中 间 4 位 又 需要 “十 6” 校 正 , 得 最 终结 果 为 1000 0000 0001, 转 换 
为 十 进 制 数 为 801。 

(2) 计算 548 十 729 时 ,两 个 加 数 分 别 为 0101 0100 1000 和 0111 0010 1001, 送 到 12 位 
无 符号 加 法 器 中 得 到 和 为 1100 0111 0001 ,最 高 4 位 和 最 低 4 位 需 * 十 6” 校 正 , 得 到 12 位 结 
果 为 0010 0111 0111 ,并 产生 进位 1。 因 而 结果 溢出 。 但 如 果 采 用 4 位 BCD 码 表示 ( 即 在 
16 位 加 法 器 中 运算 ), 则 结果 不 会 溢出 ,此 时 ,得 到 最 终 的 和 为 0001 0010 0111 0111, 即 十 进 
制 数 1277。 

19. 假定 十 进 制 数 用 8421 NBCD 码 表示 ,采用 673 加 上 (一 356) 的 模 10 补 码 实现 十 进 
制 运算 673 一 356 。 

【分 析 解 答 】 

计算 673 一 356 时 , 先 通过 将 356“ 各 位 取 反 、 末 位 加 1” 得 到 (一 356) 的 模 10 补 码 表 示 ， 
为 0110 0100 0100, 然 后 与 被 加 数 673 相 加 ,因此 ,无 符号 加 法 器 的 两 个 加 数 输入 端 分 别 为 
0110 0111 0011 和 0110 0100 0100。 这 样 加 法 器 的 输出 为 1100 1011 0111, 其 中 高 4 位 和 中 
间 4 位 需 “ 十 6 校正 ,得 到 低 12 位 结果 为 0011 0001 0111 ,同时 产生 进位 1。 在 BCD 码 减 法 
运算 中 , 若 最 高 位 有 进位 , 则 说 明 结 果 为 正 ; 若 最 高 位 没有 进位 , 则 说 明 结 果 为 负 , 需 将 数值 
部 分 “各 位 取 反 ,未 位 加 1”, 以 得 到 最 终结 果 。 因 此 ,本 题 结 果 为 十 进 制 数 317 。 
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4.1 教学 目标 和 内 容 安排 


主要 教学 目标 : 使 学 生 了 解 高 级 语言 与 汇编 语言 之 间 、 汇 编 语言 与 机 器 语言 之 间 的 
对 应 关系 ;掌握 指令 系统 设计 中 有 关 指 令 格式 、 操 作 数 类 型 、 寻 址 方式 操作 类 型 等 内 容 ; 
了 解 高 级 语言 源 程 序 如 何 转换 为 机 器 级 代码 的 过 程 ; 并 深刻 理解 CISC 和 RISC 之 间 的 
差别 。 

基本 学 习 要 求 ， 

(1) 理解 引入 高 级 语言 .汇编 语言 和 机 器 语言 的 目的 。 

(2) 了 解 “ 存 储 程序 ”工作 方式 的 内 涵 。 

(3) 了 解 指令 的 基本 格式 及 其 设计 原则 。 

(4) 理解 定 长 操作 码 指令 的 特点 。 

(5) 理解 扩展 操作 码 指令 格式 的 设计 方法 。 

(6) 理解 指令 寻 址 和 有 效 地 址 的 概念 。 

(7) 理解 各 种 常见 寻 址 方式 的 含义 和 应 用 场景 。 

(8) 理解 指令 中 地 址 码 的 位 数 与 主 存 容量 、 最 小 寻 址 单位 之 间 的 关系 。 

(9) 理解 数据 寻 址 和 指令 寻 址 的 差别 。 

(10) 理解 累加 器 型 指令 的 特点 。 

(11) 理解 堆栈 型 指令 的 特点 。 

(12) 理解 装 入 /存储 型 指令 的 特点 。 

(13) 理解 通用 寄存 器 型 指令 的 特点 。 

(14) 理解 各 种 指令 类 型 的 功能 和 操作 过 程 。 

(15) 理解 分 支 指令 、 跳 转 指令 、 调 用 指令 和 返回 指令 的 特点 和 相互 间 的 区 别 。 

(16) 理解 CISC 和 RISC 的 区 别 和 各 自 的 特点 。 

(17) 了 解 汇编 语言 和 机 器 语言 (指令 代码 ) 之 间 的 对 应 关系 。 

(18) 了 解 高 级 语言 源 程序 和 机 器 语言 (指令 代码 ) 之 间 的 对 应 关系 。 

(19) 了 解 从 高 级 语言 源 程序 到 可 执行 文件 的 转换 过 程 。 


高 级 语言 源 程序 最 终 必须 转换 成 机 器 级 指令 代码 才能 在 机 器 上 运行 ,所 以 ,指令 系统 最 
根本 的 设计 需求 来 自 高 级 语言 ,因而 ,要 能 够 很 好 地 理解 指令 系统 设计 涉及 的 各 类 问题 ,最 


好 能 够 站 在 高 级 语言 程序 员 的 角度 去 思考 。 例 如 ,对 于 操作 数 类 型 ,因为 在 高 级 语言 中 有 各 
种 不 同 长 度 的 无 符号 整数 、 带 符号 整数 等 数据 类 型 ,所 以 底层 指令 系统 中 也 需要 提供 相应 的 
不 同 长 度 和 不 同类 型 数据 的 支持 ;对 于 操作 类 型 ,因为 高 级 语言 中 存在 各 种 运算 表达 式 以 及 
循环 和 选择 等 各 类 程序 结构 ,所 以 ,指令 系统 就 必须 能 够 提供 不 同 的 运算 类 指令 和 不 同 的 程 
序 控制 类 指令 ;对 于 数据 的 寻 址 方式 ,因为 高 级 语言 中 有 简单 /复合 类 型 变量 .静态 /动态 变 
量 全 局 /局 部 变量 等 各 种 属性 数据 的 存在 ,使 得 数据 所 存放 的 位 置 具有 多 样 性 ,例如 ,部 分 
简单 变量 被 分 配 在 寄存 器 中 存放 ,复合 类 型 变量 被 分 配 在 存储 器 中 存放 ,全 局 静态 变量 被 分 
配 在 存储 器 的 静态 数据 区 ,动态 变量 被 分 配 在 存储 器 的 堆 区 存放 ,局 部 变量 被 分 配 在 存储 器 
的 栈 区 存放 等 等 ,因此 ,在 指令 中 需要 能 够 存 取 在 不 同 地 方 存放 的 数据 ,这 就 涉及 寻 址 方式 
问题 。 寻 址 方式 的 多 样 性 是 由 数据 存放 位 置 的 多 样 性 决定 的 。 

此 外 ,指令 系统 的 设计 需求 还 有 一 部 分 来 自 操作 系统 。 操 作 系 统 直接 和 硬件 打交道 , 它 
通过 对 CPU 和 1/O 接口 中 各 种 控制 和 状态 寄存 器 以 及 内 存 中 专门 的 存储 区 进行 直接 的 访 
问 来 实现 对 硬件 资源 的 管理 ,因此 ,指令 系统 中 还 必须 提供 这 些 用 来 对 硬件 资源 直接 进行 控 
制 和 管理 的 指令 ,专门 供 操作 系统 内 核 程序 所 用 。 

因此 ,在 本 章 内 容 的 教学 过 程 中 ,应 该 适当 地 结合 高 级 程序 设计 语言 .编译 器 和 操作 系 
统 的 相关 内 容 来 讲解 ,尽量 使 学 生 能 够 在 知 其 然 的 同时 也 知 其 所 以 然 。 

在 课时 有 限 的 情况 下 ,指令 系统 实例 和 程序 的 机 器 级 表示 可 以 作为 课外 阅读 材料 ,这 部 
分 内 容 基 本 上 是 具体 的 指令 系统 ,包括 MIPS、Pentium、PowerPC 等 处 理 器 的 指令 系统 ,以 
及 面向 多 媒体 处 理 的 指令 集 。 在 学 习 了 基本 原理 的 基础 上 ,学 生 通 过 阅读 与 具体 的 指令 系 
统 相关 的 资料 ,可 以 起 到 巩固 所 学 和 加 深 理解 的 作用 。 

为 了 方便 对 指令 功能 进行 形式 化 描述 ,通常 使 用 寄存 器 传送 级 语言 (Register Transfer 
Language,RTL) ,本 书 所 用 的 RTL 表示 约定 为 : R[aj] 表 示 寄 存 器 a 的 内 容 ;M[a] 表示 内 
存单 元 a 的 内 容 ;PC 的 内 容 直接 用 PC 表示 (参照 主教 材 5. 2. 1 节 的 说 明 ) 。 


4.2 主要 内 容 提要 


1. 指令 格式 设计 

指令 中 必须 明显 或 隐 含 地 给 出 以 下 信息 : 操作 码 ,操作 数 或 操作 数 的 地 址 结果 存放 的 
地 址 ,以 及 下 条 指令 的 地 址 ,通常 下 条 指令 地 址 隐 含 地 由 程序 计数 器 PC 给 出 。 按 照 指令 长 
度 是 否 固定 可 分 为 定 长 指令 字 格 式 和 变 长 指令 字 格 式 。 根 据 操作 码 长 度 是 否 固定 ,也 可 分 
为 定 长 操作 码 指令 格式 和 变 长 操作 码 指令 格式 。 采 用 定 长 指令 字 和 定 长 操作 码 方式 ,可 以 
简化 指令 地 址 计算 以 及 取 指 和 译 码 操作 ;采用 变 长 指令 字 和 变 长 操作 码 方式 , 则 指令 更 紧 
凑 , 使 得 程序 占 空间 更 少 。 

2. 操作 类 型 

根据 操作 类 型 的 不 同 , 可 以 将 指令 分 成 以 下 几 类 指令 : 

@ 数据 传送 指令 ,使 数据 在 寄存 器 \ 主 存单 元 、 栈 项 之 间 进 行 传送 。 

@ 运算 指令 ,进行 各 种 算术 运算 和 侵 辑 运算 。 

@ 字符 串 处 理 类 指令 ,进行 字符 串 查找 ,扫描 ,转换 等 。 

@ IO 指令 ,用 于 CPU 中 的 寄存 器 与 外 设 接口 中 的 寄存 器 之 间 进 行 数据 ,状态 和 命令 
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信息 的 交换 。 

@ 程序 流 控制 指令 ,如 条 件 转移 .无条件 转 移 .调用 ,返回 等 指令 。 

@ 系统 控制 指令 ,控制 机 器 的 启动 和 停止 ,进行 自愿 访 管 或 自 陷 以 及 空 操作 等 。 

3. 操作 数 类 型 

为 了 支持 高 级 语言 中 对 不 同类 型 数据 的 操作 ,必须 提供 对 不 同 数据 类 型 进行 操作 的 指 
令 , 而 且 操 作 数 宽度 也 有 多 种 ,以 对 应 高 级 语言 中 各 种 类 型 数据 的 长 度 , 如 8 位 、16 位 、 
32 位 .64 位 等 。 以 IA-32 为 例 ,提供 的 数据 类 型 有 以 下 几 类 。 

(1) 序数 或 指针 : 用 8 位 、16 位 或 32 位 无 符号 整数 表示 。 

(2) 带 符号 整数 ; 用 8 位 、16 位 、32 位 或 64 位 补 码 表 示 。 

(3) 实数 ; 用 IEEE 754 浮 点 数 格式 表示 。 

(4) 十 进 制 整数 : 用 18 位 BCD 码 (80 个 二 进位 ,其 中 符号 占 一 个 字 节 ) 表 示 。 

(5) 字符 串 : 以 字 节 为 单位 的 字符 序列 ,用 ASCII 码 表示 。 

4. 寻 址 方式 

编译 器 通常 将 高 级 语言 程序 中 定义 的 各 类 常量 和 变量 所 需 的 空间 分 配 在 不 同 的 寄存 器 
或 存储 区 中 ,例如 ,简单 变量 可 能 分 配 在 通用 寄存 器 中 ,静态 全 局 数组 变量 分 配 在 存储 空间 
的 静态 数据 区 ,动态 变量 分 配 在 存储 空间 的 动态 数据 区 ( 堆 区 ) ,局 部 变量 分 配 在 栈 区 ,等 等 ， 
而 且 对 于 数组 等 复合 变量 ,通常 在 程序 中 需要 对 每 个 基本 元 素 进 行 访问 和 操作 。 因 此 ,指令 
系统 中 必须 提供 一 套 行 之 有 效 的 寻 址 方式 ,以 方便 CPU 在 执行 指令 时 能 快速 地 定位 操作 
数 所 在 位 置 并 取得 操作 数 。 通 常 将 操作 数 所 在 的 存储 单元 的 地 址 称 为 有 效 地址。 指令 中 提 
供 的 寻 址 方式 有 以 下 几 种 。 

(1) 立即 寻 址 : 指令 中 直接 给 出 操作 数 本 身 。 

(2) 直接 寻 址 : 指令 的 地 址 码 给 出 操作 数 所 在 的 存储 单元 地 址 。 

(3) 间接 寻 址 : 指令 的 地 址 码 给 出 操作 数 所 在 的 存储 单元 地 址 所 在 的 存储 单元 地 址 。 

(4) 寄存 器 寻 址 : 指令 的 地 址 码 给 出 操作 数 所 在 的 寄存 器 的 编号 。 

(5) 寄存 器 间接 寻 址 : 指令 的 地 址 码 给 出 操作 数 所 在 的 存储 单元 地 址 所 在 的 寄存 器 的 
编号 。 

(6) 栈 寻 址 : 操作 数 约定 在 栈 中 ,总 是 在 栈 顶 取 数 或 存 数 。 

(7) 偏 移 寻 址 : 用 寄存 器 内 容 加 形式 地 址 得 到 操作 数 所 在 的 存储 单元 地 址 ,包括 变 址 
寻 址 .相对 寻 址 和 基 址 寻 址 3 种 寻 址 方式 。 

变 址 寻 址 方式 下 ,地址 码 给 出 一 个 形式 地 址 ,并 且 隐 式 或 显 式 地 指定 一 个 寄存 器 作为 变 
址 寄存 器 , 变 址 寄存 器 的 内 容 ( 称 为 变 址 值 ) 和 形式 地 址 相 加 ,得 到 操作 数 的 有 效 地 址 ,通常 
用 于 循环 体 中 对 数组 元 素 的 访问 。 

相对 寻 址 方式 下 ,指令 中 的 形式 地 址 给 出 一 个 位 移 量 也, 而 基准 地 址 由 程序 计数 器 PC 
提供 。 即 有 效 地 址 EA= (PC) 十 D, 通 常用 于 转移 指令 中 转移 目标 或 公共 子 程序 中 的 操作 
数 的 寻 址 。 

基 址 寻 址 方式 下 ,地 址 码 给 出 的 形式 地 址 作为 位 移 量 ,和 基 址 寄存 器 的 内 容 相 加 ,得 到 
有 效 地 址 。 基 址 寄存 器 可 以 在 指令 中 显 式 指定 由 某 个 通用 寄存 器 充当 ,也 可 以 用 一 个 专门 
的 基 址 寄存 器 。 

5. 条 件 码 (状态 标志 ) 的 生成 

对 应 高 级 语言 程序 中 的 选择 结构 和 循环 结构 ,相应 的 机 器 代码 中 需要 有 条 件 转移 指令 ， 


它们 根据 不 同 的 状态 标志 来 改变 程序 的 执行 顺序 。 通 常 的 状态 标志 有 CF( 进 / 借 位 标志 )、 
ZF( 零 标志 ) .OF (溢出 标志 ) .SF( 符 号 标志 ) 等 。 

6. 指令 系统 风格 

按 地 址 码 指定 风格 来 分 ,可 以 分 成 累加 器 型 栈 型 通用 寄存 器 型 和 装 入 /存储 型 指令 系 
统 。 累 加 器 型 指令 系统 中 ,其 中 一 个 操作 数 和 运算 结果 都 隐 含 存放 在 累加 器 中 ,因而 指令 长 
度 短 ,但 程序 的 指令 条 数 较 多 ,并 需要 频繁 访问 存储 器 ; 栈 型 指令 系统 中 ,操作 数 和 结果 都 隐 
含 在 栈 中 ,因而 指令 中 无 须 指定 地 址 码 ,指令 长 度 短 , 但 需 频繁 访问 栈 ,并 且 对 指令 序列 的 顺 
序 要 求 严格 ;通用 寄存 器 型 指令 系统 中 ,操作 数 明显 地 指定 在 通用 寄存 器 中 ,使 用 大 量 通用 
寄存 器 , 既 缩 短 了 指令 长 度 , 又 减少 了 访问 存储 器 的 次 数 ,所 以 现代 计算 机 大 多 采用 这 种 指 
令 设 计 风格 ; 装 入 /存储 型 指令 系统 中 ,只 有 装 入 (Load) 指 令 和 存储 (Store) 指 令 才能 访问 内 
存 , 而 运算 类 指令 的 操作 数 只 能 在 寄存 器 中 ,这 种 类 型 指令 系统 本 身 是 通用 寄存 器 型 指令 

按 指令 系统 的 复杂 度 来 分 ,可 分 成 CISC( 复 杂 指令 系统 计算 机 ) 和 RISC( 精 简 指 令 系统 
计算 机 ) 两 类 指令 系统 。CISC 指令 系统 大 多 采用 变 长 指令 字 和 扩展 操作 码 编码 方式 ,指令 
格式 多 ,指令 条 数 多 , 寻 址 方式 多 而 复杂 ,因而 指令 的 译 码 实现 复杂 ,大 多 用 微 程序 控制 器 实 
现 ;RISC 指令 系统 大 多 采用 定 长 指令 字 和 定 长 操作 码 , 指 令 格式 少 ,指令 系统 中 仅 含有 一 
些 常用 指令 ,因而 指令 条 数 少 , 寻 址 方式 少 且 简单 ,指令 的 译 码 实现 简单 ,可 用 硬 连 线路 控制 
器 实现 。RISC 处 理 器 中 设置 大 量 的 通用 寄存 器 ,可 大 大 减少 存储 器 访问 次 数 ,并 且 采 用 装 
人 /存储 型 指令 设计 风格 ,因而 大 部 分 指令 的 执行 步骤 一 臻 .规整 ,指令 的 执行 适合 采用 流水 
线 方式 。 

7. MMX 和 SIMD 指令 技术 

多 媒体 数据 处 理 中 存在 大 量具 有 共同 特征 的 操作 ,可 以 提供 一 种 同时 对 多 个 数据 元 素 
进行 相同 操作 的 指令 ,这 种 指令 被 称 为 SIMD(Single Instruction Multi Data) 指 令 。Intel 公 
司 于 1997 年 首次 提供 了 一 组 称 为 MMX 技术 的 指令 ,这 组 指令 可 以 对 8 个 64 位 寄存 器 中 
的 数据 进行 处 理 ,每 个 64 位 数据 可 以 是 8 个 字 节 ,或 4 个 字 , 或 2 个 双 字 ,或 一 个 64 位 的 
4 字 。 

8. 程序 的 机 器 级 表示 

不 管用 哪 种 语言 编写 的 程序 最 终 都 必须 被 转换 成 用 0 和 1 表示 的 机 器 代码 ,也 就 是 指 
令 序 列 。 因 为 机 器 代码 可 读 性 差 ,所 以 引入 了 与 机 器 语言 一 一 对 应 的 符号 化 表示 语言 , 称 为 
汇编 语言 。 机 器 语言 和 汇编 语言 都 是 机 器 级 表示 语言 。 程 序 的 机 器 级 表示 主要 是 编译 程序 
和 解释 程序 的 任务 。 但 是 ,对 于 指令 集体 系 结构 (ISA) 的 设计 者 来 说 ,也 必须 了 解 高 级 语言 
与 机 器 级 表示 语言 之 间 的 对 应 关系 。 

通常 ,高 级 语言 中 的 赋值 语句 被 转换 成 由 若干 运算 类 指令 构成 的 指令 序列 ; 像 f 语句 
这 样 的 选择 结构 程序 段 被 转换 为 一 段 包含 分 支 指令 (条 件 转 移 指 令 ) 的 指令 序列 ; 像 for 语 
句 这 样 的 循环 结构 程序 段 被 转换 为 包含 无 条 件 跳 转 指令 和 分 支 指令 的 被 循环 执行 的 指令 序 
列 。 此 外 ,对 于 高 级 语言 源 程序 中 的 过 程 调 用 ,也 必须 在 ISA 中 有 相应 的 支持 过 程 调用 的 
机 制 ,例如 ,必须 提供 过 程 调用 (转子 ) 指 令 和 过 程 返回 指令 ,同时 ,因为 需要 支持 嵌 套 调用 和 
递归 调用 ,所 以 还 必须 提供 对 栈 和 栈 帧 的 操作 指令 等 等 。 
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9. 指令 系统 举例 

以 MIPS 指令 集体 系 结构 为 例 说 明 。MIPS 是 典型 的 RISC 风格 指令 系统 架构 ,采用 了 
三 地 址 指令 格式 ,提供 了 32 个 32 位 通用 寄存 器 ,寄存 器 编号 占 5 位 。 

通用 寄存 器 的 汇编 表示 可 以 使 用 名 称 ( 如 $t0), 也 可 以 用 编号 (如 $0)。 此 外 ,MIPS 
中 还 提供 了 32 个 32 位 浮 点 寄存 器 ,两 个 32 位 浮 点 寄存 器 构成 一 个 64 位 双 精 度 浮 点 寄存 
器 。 为 了 实现 乘除 运算 ,MIPS 还 提供 了 两 个 乘 商 寄存 器 Hi 和 Lo, 这 两 个 寄存 器 无 须 在 指 
令 中 明显 给 出 ,因而 ,与 程序 计数 器 PC 一 样 , 它 们 没有 寄存 器 编号 。 


4.3 基本 术语 解释 


指令 (instruction) 

是 计算 机 硬件 能 够 识别 并 直接 执行 的 操作 命令 。 用 二 进 制 序列 表示 ,由 操作 码 和 操作 
数 或 操作 数 的 地 址 码 等 字段 组 成 。 

指令 系统 (instruction set) 

也 称 指令 集 , 是 计算 机 中 所 有 指令 的 集合 。 

指令 集体 系 结构 (Instruction Set Architecture,ISA) 

是 计算 机 硬件 与 系统 软件 之 间 的 接口 ,其 核心 部 分 是 指令 集 , 同 时 还 包含 数据 类 型 和 数 
据 格式 定义 、 寄 存 器 设计 、1/O 空间 的 编 址 和 数据 传输 方式 ,中断 结 构 ,计算 机 状态 的 定义 和 
切换 ,存储 保护 等 。 

指令 字 长 (instruction length) 

一 条 指令 的 二 进 制 代码 位 数 。 有 定 长 指令 字 格 式 和 变 长 指令 字 格 式 两 种 不 同 的 指令 

定 长 指令 (fixed length instruction) 

机 器 中 所 有 指令 的 位 数 是 相同 的 ,目前 定 长 指令 字 大 多 是 32 位 指令 字 。 

变 长 指令 (variable length instruction) 

机 器 中 的 指令 有 长 有 短 ,但 每 条 指令 的 长 度 一 般 都 是 8 的 倍数 。 

操作 码 (operate code) 

指令 中 用 于 指出 操作 性 质 的 字段 。 一 般 分 为 定 长 操作 码 和 扩展 操作 码 。 定 长 操作 码 是 
指 机 器 中 所 有 指令 的 操作 码 字段 位 数 相同 。 扩 展 操作 码 是 指 机 器 中 指令 的 操作 码 字段 位 数 
不 是 都 相同 ,也 称 为 不 定 长 操作 码 。 

地 址 码 (address code) 

指令 中 用 于 指出 操作 数 地 址 的 字段 。 一 条 指令 中 一 般 有 多 个 地 址 码 字 段 。 地 址 码 字段 
的 个 数 与 许多 因素 有 关 。 一 个 地 址 码 字段 可 能 是 一 个 立即 数 ,可 能 是 操作 数 所 在 的 存储 单 
元 地 址 ,可 能 是 一 个 间接 的 存储 单元 地 址 的 地 址 ,可 能 是 寄存 器 编号 ,可 能 是 I/O 端口 号 ， 
可 能 是 一 个 形式 地 址 等 。 

大 端 序 (big endian ordering) 

操作 数 在 内 存 存放 时 ,指令 中 给 出 的 地 址 是 操作 数 最 高 有 效 字 节 (MSB) 所 在 的 地 址 。 
例如 ,假设 一 个 32 位 数据 12345678H 的 地 址 为 100, 则 12H、34H、56H 和 78H 分 别 存放 在 
第 100、101、102 和 103 号 单元 中 。IBM S/370、Motorola 680x0 等 是 大 端 序 机 器 。 








小 端 序 (little endian ordering) 

操作 数 在 内 存 存 放 时 ,指令 中 给 出 的 地 址 是 操作 数 最 低 有 效 字 节 (LSB) 所 在 的 地 址 。 
例如 ,假设 一 个 32 位 数据 12345678H 的 地 址 为 100, 则 12H、34H、56H 和 78H 分 别 存放 在 
第 103、102、101 和 100 号 单元 中 。Intel 80x86 等 是 小 端 序 机 器 。 

字 地 址 (word address) 

每 个 内 存单 元 都 有 一 个 地 址 ,假定 机 器 中 一 个 字 为 32 位 , 按 字 节 编 址 ,那么 字 地 址 就 是 
指 具 有 4 的 倍数 的 那些 地 址 ,如 0、4、8、12、… ;对 应 的 还 有 半 字 地 址 (2 的 倍数 ,如 0、2、4、 
6、…) 、 双 字 地 址 (8 的 倍数 ,如 0、8、16、…) 等 。 

边界 对 齐 (boundary alignment) 

有 些 机 器 在 操作 数 存放 到 内 存单 元 时 ,要 求 按照 相应 的 地 址 边界 进行 对 齐 。 例 如 ,假定 
机 器 中 一 个 字 为 32 位 , 按 字 节 编 址 ,那么 一 个 32 位 的 数据 (如 一 个 float 型 的 变量 或 32 位 
的 int 型 整数 变量 等 ) 就 必须 存放 在 字 地 址 上 ;一 个 16 位 的 数 ( 如 16 位 short 型 的 短 整数 
等 ) 就 必须 放 在 半 字 地 址 上 ;而 8 位 的 数据 (如 char 型 字符 ) 就 可 以 放 在 任何 边界 地 址 上 而 
不 需 对 齐 。 

累加 器 (accumulator) 

在 中 央 处 理 器 CPU 中 ,累加 器 (accumulator, 简 称 ACC) 是 一 种 暂 存 器 ,用 来 存储 计算 
所 产生 的 中 间 结 果 。 早 期 机 器 中 没有 通用 寄存 器 组 ,这 种 情况 下 ,如 果 没 有 像 累 加 器 这 样 的 
暂 存 器 ,那么 在 每 次 计算 后 就 必须 把 结果 写 回 到 内 存 ,然后 可 能 还 要 再 读 回 来 。 这 样 ,就 会 
增加 访问 内 存 的 次 数 ,降低 程序 运行 的 效率 。 利 用 累加 器 进行 中 间 结 果 存 储 的 一 个 典型 例 
子 就 是 把 一 组 数字 加 起 来 。 一 开始 累加 器 设 定 为 零 ,每 个 数字 依 序 被 加 到 累加 器 中 , 当 所 有 
数字 都 被 加 入 后 ,结果 才 写 回 到 主 内 存 中 。 

程序 计数 器 (Program Counter,PC) 

又 称 指令 计数 器 或 指令 指针 IP, 是 一 个 特殊 的 地 址 寄存 器 ,专门 用 来 存放 下 一 条 要 执 
行 指令 的 地 址 。 因 为 它 本 身 是 一 个 寄存 器 ,所 以 也 称 为 指令 指针 寄存 器 或 指令 地 址 寄存 器 。 
通常 程序 是 顺序 执行 的 ,程序 所 包含 的 指令 序列 在 内 存 中 一 般 也 是 按 连 续 地 址 存放 的 。 在 
开始 运行 程序 之 前 ,总 是 将 第 一 条 指令 的 地 址 放 入 PC; 每 取出 一 条 指令 并 执行 后 ,控制 器 就 
使 PC 的 内 容 自动 增 量 (加 上 当前 指令 的 长 度 ) ,指明 下 一 条 要 执行 的 指令 所 存放 的 存储 单 
元 地 址 ,从 而 可 以 控制 指令 的 顺序 执行 ;在 遇 到 需要 改变 程序 执行 顺序 的 情况 时 ,一 般 由 转 
移 类 指令 将 转移 目标 地 址 送 往 程序 计数 器 , 即 可 实现 程序 的 转移 。 

指令 寄存 器 (Instruction Register,IR) 

用 来 保存 当前 正在 执行 的 一 条 指令 。 当 执行 一 条 指令 时 , 先 从 存储 器 取出 指令 ,然后 送 
至 指令 寄存 器 。 指 令 寄 存 器 中 的 操作 码 部 分 被 送 到 指令 译 码 器 ID(Instruction Decoder) ， 
经 ID 译 码 识别 这 条 指令 的 功能 后 ,送出 具体 的 操作 控制 信号 。 

程序 状态 字 (Program Status Word,PSW) 

表示 程序 运行 状态 的 一 个 二 进 制 位 序列 。 一 般 包含 一 些 反映 指令 执行 结果 的 标志 信息 
(如 进位 标志 、 江 出 标志 ,符号 标志 等 ) 和 设 定 的 一 些 状态 信息 (如 中 断 允 许 / 禁 止 状态 .管理 
程序 /用 户 程 序 状态 等 ) 。 

程序 状态 字 寄 存 器 (Program Status Word Register, PSWR) 

用 来 存放 程序 状态 字 的 寄存 器 。 
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标志 寄存 器 (flags register) 

80x86 体系 结构 中 用 来 表示 程序 状态 和 标志 的 寄存 器 。 

栈 (stack) 

栈 是 一 块 特殊 的 存储 区 。 采 用 “先进 后 出 ”的 方式 进行 访问 。 主 要 用 来 在 程序 切换 (如 
过 程 调用 ) 时 保存 各 种 信息 。 栈 底 固 定 不 动 , 栈 顶 浮动 ,用 一 个 专门 的 寄存 器 (SP) 来 作为 栈 
顶 指针 。 从 栈 生长 的 方向 来 分 ,有 “ 自 顶 向 下 ”和 “ 自 底 向 上 ”两 种 。 从 栈 的 位 置 来 分 ,有 硬 栈 
和 软 栈 。 硬 栈 的 栈 区 由 寄存 器 实现 , 软 栈 的 栈 区 由 内 存 实 现 。 

栈 指针 (Stack Pointer,SP) 

是 一 个 特殊 的 地 址 寄存 器 ,用 来 存放 栈 的 栈 项 指针 。 如 果 是 硬 栈 , 栈 项 指针 是 栈 顶 寄存 
器 的 编号 ;如 果 是 软 栈 , 栈 项 指针 是 栈 项 所 指向 的 存储 单元 的 地 址 。 

双 目 运算 (two-operand operate) 

需要 两 个 操作 数 才能 进行 的 运算 。 例 如 ,加 \ 减 ,乘除 与 ,或 等 算术 或 逻辑 运算 都 是 双 
目 运算 。 

单 目 运算 (one-operand operate) 

只 需要 一 个 操作 数 就 能 进行 的 运算 。 例 如 , 取 负 、 取 反 等 算术 或 逻辑 运算 都 是 单 目 
运算 。 

寻 址 方式 (addressing mode) 

在 程序 执行 过 程 中 ,需要 取 指 令 和 操作 数 , 确 定 指令 和 操作 数 的 存放 位 置 的 方式 称 为 寻 
址 方式 。 确 定 指 令 存放 位 置 的 过 程 称 为 指令 寻 址 ,确定 操作 数 存放 位 置 的 过 程 称 为 数据 
寻 址 。 

有 效 地 址 (effective address) 

存储 器 操作 数 所 在 存储 单元 的 地 址 。 若 不 采用 虚拟 存储 机 制 , 则 有 效 地 址 是 主 存 地 址 ; 
若 采 用 虚拟 存储 机 制 , 则 有 效 地 址 是 虚拟 地 址 。 

立即 寻 址 (immediate addressing) 

指令 中 的 地 址 码 直 接 给 出 操作 数 本 身 。 

直接 寻 址 (direct addressing) 

指令 中 的 地 址 码 给 出 的 是 操作 数 所 在 的 存储 单元 地 址 , 称 为 直接 地 址 。 

间接 寻 址 (indirect addressing) 

指令 中 的 地 址 码 给 出 的 是 操作 数 所 在 的 存储 单元 地 址 所 在 的 存储 单元 地 址 , 称 为 间接 
地 址 。 

寄存 器 寻 址 (register addressing) 

指令 中 的 地 址 码 给 出 的 是 操作 数 所 在 的 寄存 器 的 编号 。 

寄存 器 间接 寻 址 (register indirect addressing) 

指令 中 的 地 址 码 给 出 的 是 操作 数 所 在 的 存储 单元 的 地 址 所 存放 的 寄存 器 的 编号 。 

偏 移 寻 址 (displacement addressing) 

指令 通过 某 种 方式 给 出 一 个 形式 地 址 和 一 个 基地 址 (往往 在 某 个 寄存 器 中 ) ,经 过 相应 
的 计算 (基地 址 加 形式 地 址 ) 得 到 操作 数 所 在 的 存储 单元 地 址 。 具 体 的 偏 移 寻 址 方式 有 变 址 
寻 址 .相对 寻 址 和 基 址 寻 址 。 








变 址 寻 址 (indexing addressing) 

变 址 寻 址 方式 下 ,指令 中 的 地 址 码 给 出 一 个 形式 地 址 ,并 且 隐 含 或 明显 地 指定 一 个 寄存 
器 作为 变 址 寄存 器 , 变 址 寄存 器 的 内 容 ( 变 址 值 ) 和 形式 地 址 相 加 ,得 到 操作 数 的 有 效 地 址 ， 
根据 有 效 地址 到 存储 器 中 访问 ,去 取 操 作 数 或 写 运算 结果 。 

变 址 寄存 器 (index register) 

是 一 个 特殊 的 地 址 寄存 器 ,用 来 存放 变 址 寻 址 方式 下 的 变 址 值 ,通常 是 数组 元 素 的 下 标 
值 等 。 

相对 寻 址 (relative addressing) 

相对 寻 址 方式 下 ,指令 中 的 形式 地 址 给 出 一 个 位 移 量 D, 而 基准 地 址 由 程序 计数 器 PC 
提供 。 即 有 效 地 址 EA 二 (PC) 十 D。 位 移 量 可 正 可 负 , 也 就 是 说 ,要 找 的 可 以 是 当前 指令 前 
DD 个 单元 处 的 信息 ,也 可 以 是 当前 指令 后 D 个 单元 处 的 信息 。 

基 址 寻 址 (base addressing) 

基 址 寻 址 方式 下 ,指令 中 的 地 址 码 给 出 一 个 形式 地 址 ,作为 位 移 量 , 并 且 隐 含 或 明显 地 
指定 一 个 寄存 器 作为 基 址 寄存 器 , 基 址 寄存 器 的 内 容 和 形式 地 址 相 加 ,得 到 操作 数 的 有 效 地 
址 ,根据 有 效 地 址 到 存储 器 中 访问 ,去 取 操 作 数 或 写 运算 结果 。 

基 址 寄存 器 (base register) 

是 一 个 特殊 的 地 址 寄存 器 ,用 来 存放 基 址 寻 址 方式 下 的 基准 地 址 。 通 常 是 一 个 用 户 程 
序 的 首 地 址 或 一 块 存储 区 的 首 地 址 。 

栈 寻 址 (stack addressing) 

栈 寻 址 方式 下 ,操作 数 被 指定 在 栈 中 。 栈 寻 址 总 是 从 栈 顶 取 操 作 数 ,运算 后 的 结果 自动 
放 到 栈 顶 。 栈 顶 的 位 置 由 一 个 专门 的 栈 指针 SP 来 指示 。 所 以 ,指令 中 不 需 给 出 操作 数 地 
址 ,是 一 种 零 地 址 指令 。 与 栈 有 关 的 操作 有 人 栈 (PUSH) .出 栈 (POP) 和 运算 类 操作 。 

通用 寄存 器 (General Purpose Register, GPR) 

一 般 把 用 户 可 访问 寄存 器 称 为 通用 寄存 器 (GPR) 。 这 些 寄存 器 都 有 一 个 编号 ,在 指令 
中 用 编号 标识 寄存 器 。 所 以 执行 指令 时 ,指令 中 的 寄存 器 编号 要 送 到 一 个 地 址 译 码 器 进行 
译 码 ,然后 才能 选中 某 个 寄存 器 进行 读 写 。 通 用 寄存 器 可 以 用 来 存放 操作 数 或 运算 结果 ,或 
作为 地 址 指针 寄存 器 、 变 址 寄存 器 、 基 址 寄存 器 等 。 有 的 处 理 器 架构 把 PC 也 作为 一 个 通用 
寄存 器 使 用 。 

R-R 型 指令 (Register-Register type instruction) 

两 个 操作 数 都 在 寄存 器 中 的 指令 。 

R-S 型 指令 (Register-Storage type instruction) 

一 个 操作 数 在 寄存 器 中 , 另 一 个 操作 数 在 主 存单 元 中 的 指令 。 

S-S 型 指令 (Storage-Storage type instruction) 

两 个 操作 数 都 在 主 存单 元 中 的 指令 。 

数据 传送 指令 (data transfer instruction) 

将 数据 在 寄存 器 和 寄存 器 之 间 、 存 储 单元 和 寄存 器 之 间 进 行 传送 的 指令 。 

取 数 指令 (Load) 

特 指 将 数据 从 存储 单元 取 到 寄存 器 的 指令 。 
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存 数 指令 (Store) 

特 指 将 数据 从 寄存 器 保存 到 存储 单元 的 指令 。 

相对 转移 (relative jump) 

转移 目标 地 址 通过 PC 的 值 加 上 一 个 偏 移 量 形成 。 所 以 ,转移 到 的 目的 地 和 当前 指令 
的 位 置 有 关 。 

绝对 转移 (absolute jump) 

转移 目标 地 址 由 指令 指定 的 一 个 绝对 地 址 确定 ,而 与 当前 指令 的 位 置 没 有 关系 。 

条 件 转 移 (conditional jump, branch) 

是 一 种 分 支 指令 ,也 称 为 条 件 分 支 。 根 据 前 面 指令 或 本 条 指令 执行 的 结果 确定 是 跳 转 
到 转移 目标 地 址 处 执行 还 是 顺序 执行 。 

无 条 件 转 移 (unconditional jump) 

是 一 种 直接 跳 转 指令 ,执行 完 本 条 指令 后 ,无 条 件 地 跳 转 到 目标 转移 地 址 处 执行 。 

过 程 (procedure) 

构造 过 程 或 子 程序 是 程序 员 进 行 模块 化 程序 设计 的 一 种 手段 ,通常 程序 员 把 一 个 大 的 
任务 分 解 成 一 些 子 任务 ,每 个 子 任务 用 一 个 过 程 来 实现 ,这 样 做 ,一 方面 使 得 程序 容易 理解 ， 
男 一 方面 也 使 过 程 可 以 被 多 个 程序 使 用 , 即 可 重用 代码 。 

过 程 调用 (procedure call) 

一 个 过 程 调用 包括 将 数据 (以 过 程 参数 和 返回 值 的 形式 出 现 ) 和 控制 从 一 个 过 程 传递 到 
另 一 个 过 程 。 此 外 ,在 进入 被 调用 过 程 后 ,必须 为 被 调用 过 程 的 局 部 变量 分 配 空 间 , 并 在 退 
出 过 程 时 释放 这 些 空间 。 

跳 转 链接 指令 (Jump and Link instruction) 

用 于 将 控制 从 调用 过 程 转移 到 被 调用 过 程 的 指令 。 在 MIPS 指令 系统 中 称 为 跳 转 链接 
指令 jal。 在 有 些 机 器 的 指令 系统 中 也 被 称 为 过 程 调 用 指令 (Call instruction ) 或 转子 指令 
(意思 为 转移 到 子 程序 ) ,如 在 x86 体系 结构 中 的 call 指令 。 这 类 调用 指令 中 需要 给 出 被 调 
用 过 程 的 首 地 址 。 其 操作 过 程 主要 包括 保存 返回 地 址 到 特定 的 寄存 器 并 跳 转 到 被 调用 
过 程 。 

返回 地 址 (return address) 

跳 转 链接 指令 (调用 指令 ) 后 面 一 条 指令 的 地 址 。 也 即 被 调用 过 程 执行 完 后 必须 返回 的 
返回 点 。 

返回 指令 (Return instruction) 

用 于 从 被 调用 过 程控 制 转 回 到 调用 过 程 的 指令 。 该 指令 从 某 个 特定 的 寄存 器 或 栈 顶 取 
得 返回 地 址 ,并 按 返 回 地 址 进行 跳 转 。 

调用 过 程 (caller) 

在 过 程 调 用 中 ,通过 过 程 调用 指令 调用 一 个 过 程 或 子 程序 的 过 程 。 有 时 也 称 为 主 程序 。 

被 调用 过 程 (callee) 

用 过 程 调用 指令 (或 称 为 跳 转 链接 指令 ) 所 调用 的 过 程 或 子 过 程 。 被 调用 过 程 最 后 必须 
用 返回 指令 返回 到 调用 过 程 中 调用 指令 后 面 的 那 条 指令 继续 执行 。 

叶 过 程 (leaf procedure) 

不 调用 其 他 过 程 的 过 程 。 





过 程 帧 (procedure frame) 

大 多 数 机 器 只 提供 简单 的 过 程 调用 指令 和 返回 指令 。 一 个 过 程 调 用 中 的 参数 传递 .被 
调用 过 程 中 的 局 部 变量 的 分 配 和 释放 等 还 需要 另外 的 机 制 来 实现 。 主 要 是 通过 栈 (stack) 
来 实现 , 栈 用 来 传递 过 程 参数 ,存储 返回 信息 ,保存 寄存 器 的 内 容 和 过 程 局 部 变量 等 。 为 单 
个 过 程 分 配 的 那 部 分 栈 称 为 过 程 帧 ,也 称 为 栈 帧 (stack frame) 。 

帧 指针 (frame pointer,fp) 

在 程序 运行 过 程 中 ,可 能 会 有 多 个 过 程 嵌 套 调用 ,每 个 未 返回 的 过 程 都 有 一 个 过 程 帧 ， 
当前 正在 执行 的 过 程 的 过 程 帧 称 为 当前 帧 。 它 有 两 个 指针 定 界 , 一 个 是 指示 当前 帧 底部 的 
帧 指针 fp, 另 一 个 是 指示 当前 帧 顶部 的 栈 指针 sp。 

源 程序 文件 (source program file) 

用 某 种 高 级 语言 书写 的 源 程序 文件 ,如 C 语言 源 程序 文件 *.c 等 。 

汇编 语言 程序 文件 (assemble language source file) 

用 某 种 汇编 语言 书写 的 源 程序 文件 ,如 UNIX 系统 中 的 汇编 语言 源 程序 文件 *.s 或 
Windows 中 的 * .asm 文件 等 。 

目标 程序 文件 (object/target program file) 

编译 程序 和 汇编 程序 对 源 程序 进行 翻译 处 理 所 得 到 的 机 器 语言 程序 称 为 目标 程序 文 
件 , 是 由 机 器 指令 组 成 的 二 进 制 代码 ,如 UNIX 系统 中 的 *. o 文件 或 Windows 系统 中 的 
x .obj 文件 等 。 一 般 而 言 , 目 标 程序 文件 中 包含 目标 文件 头 ,文本 段 (机 器 代码 ) ,数据 段 、 重 
定位 信息 ,符号 表 、 调 试 信息 等 。 因 为 目标 文件 是 可 重 定位 的 ,所 以 也 称 为 可 重 定位 目标 
文件 。 

可 执行 程序 文件 (executable program file) 

通过 装 人 程序 能 被 直接 装 和 存储 器 执行 的 文件 。 一 般 而 言 , 可 执行 程序 文件 除了 不 包 
含 未 确定 的 调用 信息 、 重 定位 信息 ,符号 表 和 调试 信息 外 ,与 目标 程序 文件 有 相同 的 格式 。 
可 执行 程序 文件 中 的 模块 可 以 调用 其 他 动态 链接 库 中 的 函数 。 有 时 可 执行 程序 文件 也 称 为 
可 执行 目标 文件 。 

链接 程序 (linker/link editor) 

把 编译 或 汇编 好 的 多 个 目标 程序 文件 和 一 些 库 函 数目 标 文件 链接 生成 一 个 可 执行 程序 
文件 的 工具 软件 。 

装 入 程序 (loader) 

也 称 为 加 载 器 或 加 载 程序 。 用 于 将 可 执行 程序 文件 读 人 存储 器 并 启动 执行 的 软件 模 
块 。 一 般 来 说 ,可 执行 文件 的 装 入 是 由 操作 系统 内 核 来 实现 的 ,因此 加 载 程序 属于 操作 系统 
的 一 部 分 。 

全 局 指针 (global pointer) 寄 存 器 

操作 系统 通过 执行 装载 程序 把 一 个 可 执行 文件 装 入 内 存 时 ,必须 按照 一 定 的 规律 使 用 
内 存 。 基 于 MIPS 处 理 器 的 系统 ,通常 将 用 户 空间 分 为 三 个 部 分 : 第 一 部 分 是 从 
0x00400000 开始 的 正文 段 ,通常 也 称 为 只 读 代码 段 , 对 应 于 程序 代码 和 只 读数 据 存储 区 ;第 
二 部 分 是 数据 段 ,分 成 静态 数据 段 和 动态 数据 段 两 部 分 ,静态 数据 段 从 0x10000000 开始 ,其 
上 是 动态 数据 段 ,也 称 为 堆 区 ,该 区 域 随 着 程序 的 执行 被 动态 分 配 , 向 上 扩展 (从 低地 址 向 高 
地 址 增长 ) ;第 三 部 分 是 栈 区 ,处 于 用 户 空间 的 最 上 端 , 从 地 址 0x7FFFFFFF 开始 向 下 扩展 
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(从 高 地 址 向 低地 址 增长 )。MIPS 处 理 器 为 了 方便 地 实现 对 静态 数据 区 的 访问 ,把 地 址 
0x10008000 放 在 一 个 专门 的 寄存 器 $ gp 中 ,将 其 作为 指向 静态 数据 段 的 全 局 指针 。 这 样 
在 load 和 store 指令 中 用 16 位 偏 移 量 就 可 以 对 静态 数据 段 的 前 64KB 的 区 域 进行 方便 的 
存 取 。 

伪 指 令 (pseudo instruction) 

是 指 在 汇编 语言 程序 中 使 用 的 但 并 不 存在 的 “ 假 " 指 令 。 假 定 在 汇编 语言 程序 中 需要 经 
常 使 用 某 个 基本 功能 ,但 是 ,该 功能 并 不 能 用 单条 机 器 指令 来 实现 ,而 是 需要 用 多 条 指令 来 
实现 ,此 时 ,一 般 用 一 条 简洁 自然 的 伪 指 令 来 表示 多 条 机 器 指令 ,它们 在 功能 上 等 价 。 汇编 
程序 在 对 汇编 语言 源 程序 进行 汇编 时 ,将 伪 指 令 转换 为 等 价 的 机 器 指令 序列 。 

CISC(Complex Instruction Set Computer) 

复杂 指令 集 计算 机 。 早 期 的 计算 机 为 了 增加 功能 和 更 好 地 支持 高 级 语言 而 不 断 地 增加 
新 的 指令 类 型 ,使 CPU 可 以 直接 实现 复杂 的 指令 操作 。 这 种 指令 系统 中 的 指令 功能 复杂 ， 
寻 址 方式 多 ,指令 长 度 可 变 ,指令 格式 多 样 。 因 而 采用 这 种 指令 系统 的 计算 机 被 称 为 复杂 指 
令 集 计算 机 。 

RISC( Reduced Instruction Set Computer) 

精简 指令 集 计 算 机 。 这 种 计算 机 采用 简化 的 指令 系统 ,指令 集中 只 包含 程序 中 常用 的 
指令 ,只 有 Load 和 Store 指令 才能 访 存 ,运算 类 指令 只 能 是 R-R 型 ,提供 大 量 通 用 寄存 器 以 
减少 访 存 次 数 , 采 用 流水 线 方式 执行 指令 ,控制 器 用 硬 连 阵列 人 逻辑 实现 ,并 采用 优化 的 编译 
技术 。 


4.4 常见 问题 解答 


1. 一 台 计算 机 中 的 所 有 指令 都 是 一 样 长 吗 ? 

答 : 不 一 定 。 有 定 长 指令 字 和 不 定 长 指令 字 两 种 指令 格式 。 定 长 指令 字 格式 机 器 中 所 
有 指令 都 一 样 长 , 称 为 规整 型 指令 ,目前 定 长 指令 字 大 多 是 32 位 指令 字 。 不 定 长 指令 字 格 
式 机 器 的 指令 有 长 有 短 , 但 每 条 指令 的 长 度 一 般 都 是 8 的 倍数 。 所 以 ,一 个 指令 字 在 存储 器 
中 存放 时 ,可 能 占用 多 个 存储 单元 ;从 存储 器 读 出 并 通过 总 线 传输 时 ,可 能 分 多 次 进行 ,也 可 
能 一 次 读 多 条 指令 。 

2. 每 一 条 指令 中 都 包含 操作 码 吗 ? 

答 : 是 的 。 每 一 条 指令 都 必须 告诉 CPU 该 指令 做 什么 操作 ,所 以 必须 指定 操作 码 。 

3. 每 条 指令 中 的 地 址 码 个 数 都 一 样 吗 ? 

答 : 不 一 定 , 有 的 没有 地 址 码 , 有 的 包含 一 个 地 址 码 , 有 的 是 两 个 或 三 个 。 地 址 码 个 数 
不 一 样 的 主要 原因 有 三 个 : @ 每 条 指令 操作 数 的 个 数 可 能 不 同 。 有 的 指令 是 双 目 运算 指 
令 , 涉 及 两 个 源 操作 数 和 目的 操作 数 ,有 的 是 单 目 运算 ,只 涉及 一 个 源 操作 数 和 目的 操作 数 ， 
还 有 的 指令 只 是 控制 操作 ,不 涉及 操作 数 ,如 停机 、 复 位 、 空 操作 等 指令 。 所 以 每 条 指令 涉及 
的 操作 数 个 数 不 同 。@ 每 个 操作 数 的 寻 址 方式 可 能 不 同 。 不 同 的 寻 址 方式 给 出 的 地 址 码 个 
数 也 不 同 。 加 地 址 码 的 省 略 方式 可 能 不 同 。 有 的 操作 数 或 地 址 码 用 的 是 隐 含 指定 方式 ,在 
指令 中 省 略 , 不 明显 给 出 ,如 : 累加 器 , 栈 项 等 。 综 上 所 述 , 每 条 指令 的 地 址 码 个 数 可 能 相差 
很 大 。 


4. 一 条 指令 中 的 所 有 操作 数 都 采用 相同 的 寻 址 方式 吗 ? 

答 : 不 一 定 。 规 整 型 指令 集中 ,一 般 一 条 指令 只 包含 一 种 寻 址 方式 ,这 样 , 在 指令 操作 
码 中 就 隐 含 了 寻 址 方式 ,不 需要 专门 有 寻 址 方式 字段 。 但 是 ,对 于 不 规整 型 指令 集 ,一 条 指 
令 中 的 若干 操作 数 可 能 存放 在 不 同 地 方 ,因而 每 个 操作 数 可 能 有 各 自 的 寻 址 方式 。 

5. 指令 中 要 明显 给 出 下 一 条 指令 的 地 址 吗 ? 

答 : 不 需要 。 指 令 在 主 存 中 按 执行 顺序 连续 存放 。 大 多 数 情况 下 指令 被 顺序 执行 ,只 
有 遇 到 转移 指令 (如 无 条 件 转移 .条件 分 支 .调用 和 返回 等 指令 ) 才 改变 指令 执行 的 顺序 。 所 
以 ,可 以 用 一 个 专门 的 计数 寄存 器 来 存放 下 一 条 要 执行 的 指令 地 址 ,而 不 需要 在 指令 中 专门 
给 出 下 一 条 指令 的 地 址 。 这 个 计数 器 称 为 程序 计数 器 PC 或 指令 指针 IP。 

当 顺 序 执行 时 ,CPU 直接 通过 对 PC 加 *1? 来 使 PC 指向 下 一 条 顺序 执行 的 指令 ,这 里 
的 “1? 是 指 一 条 指令 的 长 度 , 即 当前 指令 所 占 的 存储 单元 数 ; 当 执行 到 转移 指令 时 ,根据 指令 
执行 的 结果 进行 相应 的 地 址 运算 ,把 运算 得 到 的 转移 目标 地 址 送 到 PC 中 ,使 得 执行 的 下 一 
条 指令 为 需要 转移 到 的 目标 指令 。 

6. 一 个 操作 数 在 内 存 可 能 占 多 个 单元 ,怎样 在 指令 中 给 出 操作 数 的 地 址 呢 ? 

答 : 现代 计算 机 大 多 采用 字 节 编 址 方式 , 即 一 个 存储 单元 只 能 存放 一 个 字 节 的 信息 。 
一 个 操作 数 ( 如 char 型 .int 型 .float 型 ,double 型 ) 可 能 是 8 位 .16 位 、32 位 或 64 位 等 , 因 
此 ,可 能 占用 1 个 .2 个 ,4 个 或 8 个 存储 单元 。 也 就 是 说 ,一 个 操作 数 可 能 有 多 个 存储 地 址 
与 之 对 应 ,在 指令 中 给 出 哪个 地 址 呢 ? 

有 两 种 不 同 的 地 址 指定 方式 : 大 端 方式 和 小 端 方式 。 大 端 方式 下 ,指令 中 给 出 的 地 址 
是 操作 数 最 高 有 效 字 节 (MSB) 所 在 的 地 址 。 小 端 方式 下 ,指令 中 给 出 的 地 址 是 操作 数 最 低 
有 效 字 节 (LSB) 所 在 的 地 址 。 

7, 地 址 码 位 数 与 地 址 空间 大 小 和 编 址 单位 的 关系 是 什么 ? 

答 , 指令 中 的 地 址 码 如 果 是 存储 单元 地 址 ,那么 ,地 址 码 的 位 数 与 地 址 空间 大 小 和 编 址 
单位 的 长 度 有 关 。 编 址 单位 的 长 度 就 是 存储 单元 的 宽度 ,也 就 是 最 小 的 寻 址 单位 。 存 储 器 
可 以 按 字 节 编 址 (8 位 ) ,也 可 以 按 字 编 址 (如 16 位 、32 位 等 )。 地 址 空间 大 小 和 编 址 单位 确 
定 后 ,地 址 码 的 位 数 就 被 确定 了 。 例 如 , 若 地 址 空间 大 小 为 4GB, 编 址 单位 是 字 节 , 则 存储 
单元 地 址 就 是 32 位 (因为 4GB=22B) ; 若 按 字 (假定 一 个 字 为 32 位 ) 编 址 , 则 存储 单元 地 址 
就 是 30 位 (因为 ,4GB=2*B=2”X4B)。 

8. 累加 器 型 指令 有 什么 特点 ? 

答 : 累加 器 型 指令 的 一 个 源 操作 数 和 目 操作 数 总 是 在 累加 器 中 ,是 隐 含 指定 的 ,所 以 指 
令 中 不 需要 给 出 累加 器 的 编号 。 因 而 ,累加 器 型 指令 的 指令 字 相对 来 说 较 短 ,但 由 于 每 次 运 
算 结果 都 只 能 放 到 累加 器 中 ,可 能 会 增加 一 些 将 累加 器 数据 存 和 存储 单元 的 指令 ,而 使 程序 
所 含 指令 数 增加 。 

9. 栈 型 指令 有 什么 特点 ? 

答 : 与 栈 有 关 的 操作 有 人 和 人 栈 (PUSH) .出 栈 (POP) 和 运算 类 操作 。 运 算 类 指令 分 单 目 
运算 和 双 目 运算 ,总 是 从 栈 顶 取 操作 数 ,运算 后 的 结果 自动 放 到 栈 顶 。 所 以 ,指令 中 不 需要 
给 出 操作 数 地 址 ,因此 , 栈 型 指令 的 指令 字 较 短 。 但 因为 所 有 的 操作 数 都 只 能 在 栈 项 ,所 以 ， 
完成 同样 一 个 程序 的 操作 步骤 会 增加 ,使 得 程序 所 含 指令 数 增加 。 

栈 指令 的 访 存 次 数 取决 于 采用 的 是 软 栈 还 是 硬 栈 。 如 果 是 软 栈 ( 栈 区 由 内 存 实现 ) ,对 
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于 双 目 运算 ,需要 访问 4 次 内 存 : 取 指 、 取 源 数 1、 取 源 数 2、 存 结果 ;如 果 是 硬 栈 ( 栈 区 由 寄 
存 器 实现 ) , 则 只 需 取 指令 时 访问 一 次 内 存 。 

10. 通用 寄存 器 型 指令 有 什么 特点 ? 

答 : 通用 寄存 器 型 指令 ,是 相对 于 累加 器 型 指令 和 栈 型 指令 而 言 的 ,指令 中 的 操作 数 和 
运算 的 结果 既 不 是 隐 含 在 累加 器 中 ,也 不 是 隐 含 在 栈 中 。 而 是 在 CPU 中 提供 了 多 个 通用 
寄存 器 ,操作 数 和 结果 可 以 放 在 这 些 寄存 器 中 ,指令 必须 明显 地 指出 操作 数 和 结果 在 哪个 寄 
存 器 或 哪个 存储 单元 中 ,要 给 出 寄存 器 的 编号 或 存储 单元 地 址 。 目 前 大 多 数 指令 系统 采用 
通用 寄存 器 型 指令 风格 。 

11. 装 入 /存储 型 指令 有 什么 特点 ? 

答 : 装 人 /存储 型 指令 是 用 在 规整 型 指令 系统 中 的 一 种 通用 寄存 器 型 指令 风格 。 为 了 
规整 指令 格式 ,使 指令 具有 相同 的 长 度 , 规 定 只 有 装 人 (Load) 指 令 和 存储 指令 (Store) 才 能 
访 存 ,而 运算 指令 不 能 直接 访 存 ,只 能 从 寄存 器 取 数 进行 运算 ,运算 的 结果 也 只 能 送 到 寄存 
器 。 因 为 寄存 器 编号 较 短 ,而 存储 单元 地 址 位 数 较 长 ,通过 某 种 方式 可 以 使 运算 指令 和 访 存 
指令 的 长 度 一 致 

这 种 装 入 /存储 型 风格 的 指令 系统 最 大 的 特点 是 指令 格式 规整 ,指令 长 度 一 致 ,一 般 为 
32 位 。 由 于 只 有 Load/Store 指令 才能 访问 内 存 , 程 序 中 可 能 会 包含 许多 装 入 指令 和 存储 
指令 ,而 且 ,与 一 般 的 通用 寄存 器 型 指令 风格 相 比 ,其 程序 中 包含 的 指令 数 会 更 多 。 

12. 指令 寻 址 方式 和 数据 寻 址 方式 有 什么 不 同 ? 

答 : 在 程序 执行 过 程 中 ,需要 取 指令 和 操作 数 ,确定 指令 存放 位 置 的 过 程 称 为 指令 寻 址 
方式 ,确定 操作 数 存放 位 置 的 过 程 称 为 数据 寻 址 方式 。 指 令 寻 址 和 数据 寻 址 其 复杂 度 是 不 
一 样 的 。 

指令 寻 址 : 指令 基本 上 按 执行 顺序 存放 在 存储 器 中 ,执行 过 程 中 ,指令 总 是 从 存储 单元 
被 取 到 指令 寄存 器 IR 中 。 顺 序 执行 时 ,用 指令 计数 器 PC 二 “1? 来 得 到 下 一 条 指令 的 地 址 ; 
跳 转 执行 时 ,通过 转移 指令 的 寻 址 方式 ,计算 出 转移 目标 地 址 ,然后 送 到 PC 中 即 可 。 转 移 
目标 地 址 的 形成 方式 主要 有 三 种 : 立即 寻 址 (直接 地 址 ) 、 相 对 寻 址 (相对 地 址 ) 和 间接 寻 址 
(间接 地 址 ) 。 

数据 寻 址 : 开始 时 ,数据 被 存放 在 存储 器 中 ,在 指令 执行 过 程 中 ,存储 器 中 的 数据 可 能 
被 装 入 到 CPU 的 寄存 器 中 ,寄存 器 数据 可 能 被 存储 到 存储 器 中 或 者 特定 的 栈 区 ;还 有 的 操 
作 数 可 能 是 1/O 端口 中 的 内 容 , 或 本 身 就 包含 在 指令 中 ( 即 立 即 数 )。 另 外 ,运行 的 结果 也 
可 能 要 被 送 到 CPU 的 寄存 器 \ 栈 、1/O 端口 或 存储 单元 中 ,所 以 ,数据 的 寻 址 要 涉及 对 寄存 
器 、 存 储 单元 、 栈 .I/O 端口 立即 数 等 的 访问 。 此 外 ,操作 数 可 能 是 某 个 数组 的 元 素 ,或 者 是 
结构 (struct) 或 联合 (union) 类 型 数据 中 的 成 员 分 量 。 综 上 所 述 ,数据 的 寻 址 比 指令 的 寻 址 
要 复杂 得 多 。 

13. 如 何 指定 指令 的 寻 址 方式 ? 

答 : CPU 根据 指令 约定 的 寻 址 方式 对 地 址 码 的 有 关 信 息 进行 解释 ,以 找到 下 一 条 要 执 
行 的 指令 或 指令 所 需 的 操作 数 。 有 的 指令 设置 专门 的 寻 址 方式 字段 , 显 式 说 明 采 用 何 种 寻 
址 方式 ,有 的 指令 通过 操作 码 隐 含 寻 址 方式 。 

规整 型 指令 系统 一 般 在 一 条 指令 中 只 包含 一 种 寻 址 方式 ,这 样 ,就 可 在 指令 操作 码 中 隐 
含 寻 址 方式 ,不 需要 专门 有 寻 址 方式 字段 。 但 是 ,对 于 不 规整 型 指令 系统 ,一 条 指令 中 的 若 


干 操作 数 可 能 存放 在 不 同 的 地 方 ,因而 每 个 操作 数 可 能 有 各 自 的 寻 址 方式 字段 。 

14. 指令 的 操作 数 可 能 存放 在 机 器 的 哪些 地 方 ? 

答 : 指令 的 操作 数 可 能 存放 在 内 存单 元 、 寄 存 器 、 栈 和 1/O 端口 中 ,或 者 直接 存在 于 指 
令 本 身 中 。@ 操 作 数 在 存储 单元 中 ,指令 必须 以 某 种 方式 给 出 存储 单元 的 地 址 。 又 可 分 为 
以 下 几 种 情况 : 对 单个 独立 的 操作 数 进行 处 理 ; 对 一 个 数组 中 的 若干 个 连续 元 素 或 一 个 数 
组 元 素 进行 处 理 ;对 一 个 表格 或 表格 中 的 某 个 元 素 进行 处 理 ,等 等 ,这 些 不 同 的 情况 需要 提 
供 不 同 的 寻 址 方式 进行 操作 数 的 访问 。@ 操 作 数 在 寄存 器 中 ,指令 中 只 要 直接 给 出 寄存 器 的 
编号 即 可 。@) 操 作 数 在 栈 区 , 若 有 专门 的 栈 指令 , 则 指令 中 不 需要 给 出 操作 数 的 地 址 ,数据 的 
地 址 隐 含 地 由 栈 指 针 给 出 。@ 操 作 数 在 IO 端口 中 , 当 某 个 IO 端口 中 的 寄存 器 内 容 要 和 
CPU 中 的 寄存 器 内 容 交换 时 ,要 用 1/O 指令 ,在 1/O 传送 指令 中 , 需 提 供 IO 端口 号 。@ 操 作 
数 是 指令 中 的 立即 数 , 此 时 ,操作 数 是 指令 的 一 部 分 ,直接 从 指令 中 的 立即 数字 段 取 操作 数 。 

15. 有 哪些 常用 的 数据 寻 址 方式 ? 

答 : 数据 寻 址 方式 可 以 归 为 以 下 几 类 。@ 立 即 寻 址 。 指 令 中 的 立即 数字 段 可 以 作为 操 
作 数 ,也 可 以 作为 直接 转移 地 址 。 取 到 ALU 运算 前 ,可 能 要 对 其 进行 扩展 。@ 直 接 寻 址 
类 。 指 令 中 直接 给 出 操作 数 所 在 的 寄存 器 编号 ,1/O 端口 号 或 存储 单元 地 址 ,如 直接 寻 址 方 
式 、 寄 存 器 寻 址 方式 。@) 间 接 寻 址 类 。 操 作 数 在 存储 单元 中 ,而 操作 数 的 地 址 存放 在 寄存 器 
或 男 一 个 存储 单元 中 ,指令 中 给 出 操作 数 的 地 址 所 在 的 寄存 器 编号 或 存储 单元 地 址 ,如 间接 
寻 址 方式 、 寄 存 器 间接 寻 址 方式 。@ 偏 移 寻 址 类 。 指 令 通 过 某 种 方式 给 出 一 个 形式 地 址 和 
一 个 基地 址 (在 某 个 寄存 器 中 ) ,经 过 相应 的 计算 (基地 址 加 形式 地 址 ) 得 到 操作 数 所 在 的 存 
储 单元 地 址 。 有 变 址 寻 址 、 相 对 寻 址 和 基 址 寻 址 三 种 方式 。 

16. 直接 寻 址 的 操作 数 要 几 次 访 存 ? 

答 : 一 次 。 只 要 根据 指令 中 给 出 的 直接 地 址 进行 一 次 存储 访问 ,取出 来 的 就 是 操作 数 。 

17. 间接 寻 址 的 操作 数 要 进行 几 次 存储 访问 ? 

答 : 至 少 两 次 。 先 根据 指令 中 给 出 的 间接 地 址 进行 一 次 存储 访问 ,取出 来 的 是 操作 数 
所 在 的 存储 单元 地 址 ;再 根据 操作 数 所 在 的 存储 单元 地 址 访 存 一 次 ,取出 来 的 才 是 操作 数 。 
所 以 ,一 共有 两 次 访 存 。 如 果 是 多 级 间接 地 址 , 则 要 多 次 访 存 。 

18. 寄存 器 寻 址 的 操作 数 要 几 次 访 存 ? 

答 : 不 需要 访 存 。 从 指定 寄存 器 中 取出 的 就 是 操作 数 。 

19. 寄存 器 间接 寻 址 的 操作 数 要 几 次 访 存 ? 

答 : 一 次 。 先 从 指令 给 出 的 寄存 器 中 取出 操作 数 所 在 的 存储 单元 地 址 ,再 根据 操作 数 
所 在 的 存储 单元 地 址 访 存 一 次 ,得 到 的 就 是 操作 数 。 

20. 什么 是 变 址 寻 址 方式 ? 

答 : 变 址 寻 址 方式 下 ,指令 中 的 地 址 码 给 出 一 个 形式 地 址 ,并 且 隐 含 或 明显 地 指定 一 个 
寄存 器 作为 变 址 寄存 器 , 变 址 寄存 器 的 内 容 ( 变 址 值 ) 和 形式 地 址 相 加 ,得 到 操作 数 的 有 效 地 
址 ,根据 有 效 地 址 到 内 存 访问 ,去 取 操 作 数 或 写 运算 结果 。 

变 址 寻 址 方式 的 应 用 很 广泛 。 最 基本 的 使 用 场合 是 对 数组 元 素 的 访问 。 指 令 将 数组 的 
首 地 址 指定 为 形式 地 址 , 变 址 寄存 器 的 内 容 是 数组 元 素 的 下 标 , 随 着 下 标的 变化 ,可 以 访问 
数组 中 不 同 的 元 素 。 所 以 变 址 寄存 器 的 内 容 是 变化 的 ,反映 的 是 所 访问 的 数据 到 数组 首 地 
址 的 距离 , 称 为 变 址 值 。 这 种 应 用 场合 下 ,形式 地 址 的 位 数 较 长 ,而 变 址 值 位 数 少 。 变 址 寻 
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址 方式 的 指令 一 般 包含 在 一 个 循环 体内 。 每 次 进入 循环 时 , 变 址 值 都 增 或 减 一 个 定 长 值 , 这 
个 定 长 值 等 于 数组 元 素 的 长 度 。 

21. 什么 是 基 址 寻 址 方式 ? 

答 : 基 址 寻 址 方式 下 ,指令 中 的 地 址 码 给 出 一 个 形式 地 址 ,作为 位 移 量 , 并 且 隐 含 或 明 
显 地 指定 一 个 寄存 器 作为 基 址 寄存 器 , 基 址 寄存 器 的 内 容 和 形式 地 址 相 加 ,得 到 操作 数 的 有 
效 地 址 ,根据 有 效 地 址 到 内 存 访问 ,去 取 操 作 数 或 写 运算 结果 。 

基 址 寻 址 的 典型 应 用 有 两 个 : 一 个 是 程序 重 定位 ,在 多 道 程序 运行 的 系统 中 ,每 个 用 户 
程序 在 一 个 逻辑 地 址 空间 里 编写 程序 。 装 入 运行 时 ,由 操作 系统 给 用 户 程序 分 配 主 存 空间 ， 
每 个 用 户 程 序 有 一 个 基地 址 ,存放 在 基 址 寄存 器 中 ,在 程序 执行 时 ,通过 基 址 寄存 器 的 值 加 
上 指令 中 的 形式 地 址 就 可 以 形成 实际 的 主 存单 元 地 址 。 另 一 个 应 用 是 扩展 有 限 长 度 指令 的 
寻 址 空间 。 即 在 运行 时 将 某 个 存储 区 的 首 地 址 或 程序 段 的 首 地 址 装 入 基 址 寄存 器 ,而 形式 
地 址 给 出 要 访问 的 单元 相对 于 该 首 地 址 的 距离 ( 即 偏 移 量 ) ,因此 指令 中 只 要 用 较 短 的 地 址 
码 来 表示 偏 移 量 。 访 问 操作 数 时 ,用 基 址 寄存 器 的 值 和 偏 移 量 相 加 ,得 到 操作 数 所 在 的 存储 
单元 地 址 。 只 要 基 址 寄存 器 的 内 容 更 改 到 另外 的 一 个 存储 地 址 , 则 操作 数 的 地 址 空间 就 移 
到 另 一 个 存储 区 间 。 因 而 可 以 访问 到 整个 地 址 空间 ,以 实现 短 地 址 访问 大 空间 的 目的 。 

22. 变 址 寻 址 和 基 址 寻 址 的 区 别 是 什么 ? 

答 : 变 址 寻 址 方式 和 基 址 寻 址 方式 的 有 效 地 址 形成 过 程 类 似 。 但 是 , 基 址 寻 址 方式 与 
变 址 寻 址 方式 在 以 下 两 个 方面 不 同 : 具体 应 用 的 场合 不 同 。 变 址 寻 址 面向 用 户 ,可 用 于 
访问 字符 串 .数组 .表格 等 成 批 数据 或 其 中 的 某 些 元 素 ; 基 址 寻 址 面向 系统 ,用 于 解决 程序 的 
重 定位 问题 和 短 地 址 访问 大 空间 的 问题 。@ 使 用 方式 不 同 。 变 址 寻 址 时 ,指令 中 提供 的 形 
式 地 址 是 一 个 基准 地 址 ,位 移 量 由 变 址 寄存 器 给 出 ;而 基 址 寻 址 时 ,指令 中 给 出 的 形式 地 址 
为 位 移 量 ,而 基 址 寄存 器 中 存放 的 是 基准 地 址 。 不 过 ,这 里 所 讲 的 使 用 方式 并 不 是 绝对 的 ， 
实际 中 可 能 会 有 不 同 的 应 用 场合 和 使 用 方式 。 

23. 什么 是 相对 寻 址 方式 ? 

答 : 相对 寻 址 方式 的 有 效 地 址 形成 方法 如 下 : 指令 中 的 形式 地 址 给 出 一 个 位 移 量 D， 
而 基准 地 址 由 程序 计数 器 PC 提供 。 即 有 效 地 址 为 EA 二 (PC) 十 D。 位 移 量 给 出 的 是 相对 
于 当前 指令 所 在 存储 单元 的 距离 ,位移 量 可 正 可 负 。 也 就 是 说 ,要 找 的 可 以 是 当前 指令 前 D 
个 单元 处 的 信息 ,也 可 以 是 当前 指令 后 D 个 单元 处 的 信息 。 

24. 相对 寻 址 方式 用 在 哪些 场合 ? 

答 : 相对 寻 址 方式 用 在 以 下 两 种 场合 。 四 公共 子 程序 的 浮动 。 因 为 公共 子 程序 可 能 被 
许多 用 户 程序 调用 ,因而 会 随 着 用 户 程序 装 入 到 内 存 不 同 的 地 方 运行 。 为 了 让 公共 子 程序 
能 在 不 同 的 内 存 区 正确 运行 ,一 般 在 公共 子 程序 内 部 采用 相对 寻 址 方式 ,以 保证 指令 的 操作 
数 总 在 相对 于 指令 距离 一 定 的 单元 内 。 这 样 ,不 管子 程序 浮动 到 哪里 ,指令 和 数据 的 相对 位 
置 不 变 。 例 如 ,现行 指令 的 地 址 为 2000H ,指令 中 给 出 的 形式 地 址 为 05H ,说 明 操作 数 在 当 
前 指令 后 面 第 05H 个 单元 处 , 即 2005H 处 。 当 程序 向 后 浮动 了 1000H, 使 当前 指令 的 地 址 
为 3000H 时 ,此 时 公共 子 程序 中 的 指令 .数据 以 及 相对 位 置 都 不 变 , 指 令 中 给 出 的 相对 地 址 
还 是 05H ,操作 数 还 是 应 该 在 当前 指令 后 面 的 第 05H 个 单元 处 ,所 以 应 该 在 3005H 处 , 因 
此 ,指令 取 到 的 还 是 同一 个 数据 。@ 转 移 目标 地 址 的 寻 址 。 当 需要 转 到 当前 指令 的 前 面 或 
后 面 第 条 指令 执行 时 ,可 以 用 相对 寻 址 方式 。 此 时 ,得 到 的 转移 地 址 是 一 个 相对 地 址 。 


25. 相对 寻 址 方式 中 如 何 确定 相对 位 置 ? 

答 : 相对 寻 址 方式 中 ,相对 位 置 的 确定 比较 复杂 。 必 须 注 意 两 个 方面 的 问题 : 位 移 
量 的 问题 。 位 移 量 位 数 有 限 ,在 进行 有 效 地 址 计算 时 需要 扩展 。 一 般 位 移 量 用 补 码 表示 ,所 
以 应 采用 补 码 扩展 填充 方式 ( 即 符号 扩展 方式 ) 。 回 基准 地 址 问题 。 相 对 寻 址 的 基本 思路 是 
把 相对 于 当前 指令 前 面 或 者 后 面 第 ”个 单元 作为 操作 数 或 目标 转移 指令 的 地 址 。 但 在 具体 
实现 时 ,不 同 机 器 对 “当前 指令 ”的 含义 有 不 同 的 理解 。 有 的 机 器 在 计算 相对 地 址 时 ,PC 中 
存放 的 还 是 当前 正在 执行 的 指令 的 地 址 ,但 有 的 机 器 PC 加 *1” 的 操作 在 取 指 令 的 同时 完 
成 ,所 以 在 计算 相对 地 址 时 ,PC 中 已 经 是 下 一 条 指令 的 地 址 。 因 此 ,不 同 的 机 器 在 计算 相 
对 地 址 时 可 能 有 一 点 细微 的 差别 。 

26. 栈 寻 址 方式 中 如 何 对 栈 进 行 操作 ? 

答 : 栈 是 一 块 特殊 的 存储 区 。 采 用 "先进 后 出 ”的 方式 进行 访问 。 栈 底 固定 不 动 , 栈 项 
浮动 ,用 一 个 专门 的 寄存 器 (SP) 来 作为 栈 顶 指针 。 从 栈 生长 的 方向 来 分 ,可 以 有 ”* 自 项 向 
下 ”和 * 自 底 向 上 ”两 种 ,它们 在 进 .出 栈 时 对 栈 指针 的 修改 是 不 同 的 。 若 每 个 栈 中 的 元 素 只 
占 一 个 内 存单 元 , 则 修改 指针 时 ,通过 “十 1? 或 “一 1? 实 现 ; 若 占 多 个 内 存单 元 , 则 应 该 加 上 或 
减 去 相应 的 值 。 

假定 栈 指针 指向 的 总 是 栈 顶 处 非 空 元 素 , 则 应 该 按 以 下 方式 修改 栈 指针 。 对 于 “ 自 底 向 
上 ?生成 的 栈 , 进 栈 时 先 修改 栈 指针 : (SP) 十 1->SP, 然 后 再 压 入 数据 ;出 栈 时 先 将 数据 弹 
出 ,然后 再 修改 栈 指针 : (SP) 一 1>SP。 对 于 * 自 顶 向 下 ”生成 的 栈 , 进 栈 时 先 修改 栈 指针 ， 
(SP) 一 1>SP, 然 后 再 压 人 数据 ;出 栈 时 先 将 数据 弹出 ,然后 再 修改 栈 指 针 : (SP) 十 1~SP。 

假定 栈 指针 指向 的 总 是 栈 顶 处 的 空 元 素 , 则 应 该 按 以 下 方式 修改 栈 指针 。 对 于 “ 自 底 向 
上 ?生成 的 栈 , 进 栈 时 先 压 人 数据 ,然后 再 修改 栈 指针 : (SP) 十 1-~SP; 出 栈 时 先 修改 栈 指 
针 : (SP) 一 1SP, 然 后 再 将 数据 弹出 。 对 于 * 自 项 向 下 ”生成 的 栈 , 进 栈 时 先 压 人 数据 , 然 
后 再 修改 栈 指针 : (SP) 一 1~SP; 出 栈 时 先 修改 栈 指针 : (SP) 十 1>SP ,然后 再 将 数据 弹出 。 

27. 返回 指令 要 不 要 有 地 址 字段 ? 

答 : 不 一 定 。 子 程序 (过 程 ) 的 最 后 一 条 指令 一 定 是 返回 指令 。 一 般 返 回 地 址 保存 在 栈 
中 ,所 以 返回 指令 中 不 需要 明显 给 出 返回 地 址 ,直接 从 栈 顶 取 地 址 作为 返回 地 址 。 如 果 有 些 
计算 机 不 采用 栈 保存 返回 地 址 ,而 是 存放 到 其 他 不 确定 的 地 方 , 则 返回 指令 中 必须 有 一 个 地 
址 码 ,用 来 指出 返回 地 址 或 指出 返回 地 址 的 存放 位 置 。 

28. 转移 指令 和 转子 (调用 ) 指 令 的 区 别 是 什么 ? 

答 : 转移 指令 有 无 条 件 转移 指令 和 条 件 转移 指令 (也 叫 分 支 指令 )。 这 种 转移 指令 用 于 
改变 程序 执行 的 顺序 ,转移 后 不 再 返回 来 执行 ,所 以 无 须 保存 返回 地 址 。 而 转子 指令 是 一 种 
子 程序 调用 指令 , 子 程序 执行 结束 时 ,必须 返回 到 转子 指令 后 面 的 指令 执行 。 所 以 转子 指令 
执行 时 ,除了 和 转移 指令 一 样 要 计算 跳 转 的 目标 地 址 外 ,还 要 保存 返回 地 址 。 一 般 将 转子 指 
令 后 面 那 条 指令 的 地 址 作为 返回 地 址 保存 到 栈 中 或 特定 的 寄存 器 中 。 


4.5 单项 选择 题 


1. 寄存 器 中 的 值 有 时 是 地 址 ,有 时 是 数据 ,它们 在 形式 上 没有 差别 ,只 有 通过 ( 。“) 才 
能 识别 它 是 数据 还 是 地 址 。 
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A. 寄存 器 编号 B. 判断 程序 
C. 指令 操作 码 或 寻 址 方式 位 D. 时 序 信号 
元 2. 单 地 址 双 目 运算 类 指令 中 , 除 地 址 码 指明 的 一 个 操作 数 以 外 , 另 一 个 操作 数 通 常 采 
用 ( 
A. 栈 寻 址 方式 ”B. 立即 寻 址 方式 ” C. 间接 寻 址 方式 ” D. 隐 含 指定 方式 
3. 某 计算 机 为 定 长 指令 字 结 构 , 采 用 扩展 操作 码 编码 方式 ,指令 长 度 为 16 位 ,每 个 地 
址 码 占 4 位 ,三 地 址 指令 15 条 ,二 地 址 指令 8 条 ,一 地 址 指令 127 条 , 则 剩 下 的 零 地 址 指令 


最 多 有 ( “) 条 。 
A. 15 B. 16 G31 D. 32 
4. 在 计算 机 系统 中 ,描述 系统 运行 状态 的 部 件 是 (。”)。 
A. 程序 计数 器 B， 累 加 器 
C. 通用 寄存 器 D. 程序 状态 字 寄 存 器 


5. 下 列 有 关 标 志 寄 存 器 的 叙述 中 ,错误 的 是 ( 和 
A. 可 用 它 来 存放 执行 指令 得 到 的 各 种 标志 信息 
B. 可 通过 指令 直接 访问 标志 寄存 器 并 修改 其 值 
C. 条 件 转移 指令 根据 其 中 的 标志 位 确定 PC 的 值 
D. 不 需 像 通用 寄存 器 那样 对 标志 寄存 器 进行 编号 
6. 以 下 给 出 的 4 种 指令 类 型 中 ,执行 时 间 最 长 的 指令 类 型 是 ( 入 


A. RR 型 B. RS 型 C. SS 型 D. RI 型 
7. 假定 指令 地 址 码 给 出 的 是 操作 数 的 存储 地 址 , 则 该 操作 数 采用 的 是 ( ”) 寻 址 
方式 。 
A. 立即 B. 直接 C. 基 址 D. 相对 
8. 假定 指令 地 址 码 给 出 的 是 操作 数 本 身 , 则 该 操作 数 采用 的 是 (  ) 寻 址 方式 。 
A. 立即 B. 直接 C. 基 址 D. 相对 
9. 假定 指令 地 址 码 给 出 的 是 操作 数 所 在 的 寄存 器 的 编号 , 则 该 操作 数 采用 的 是 (  ) 
寻 址 方式 。 
A. 直接 B. 间接 C. 寄存 器 直接 D. 寄存 器 间接 


10. 寄存 器 间接 寻 址 方式 的 操作 数 存放 在 ( 。“) 中 。 
A. 通用 寄存 器 。”B. 存储 单元 C. 程序 计数 器 D. 堆栈 
11. 若 指令 地 址 码 为 D, 则 相对 寻 址 方式 下 操作 数 的 有 效 地 址 为 ( 。”)。 


;DB B. MLD] C. RLD] D: PC+HD 

12. 若 变 址 寄存 器 编号 为 X, 形 式 地 址 为 D, 则 变 址 寻 址 方式 的 有 效 地 址 为 ( 。 )。 
A. RLX] 十 D B. RLX] 十 RLD] 
C. M[RLX]+D] D. M[R[X]+M[D]] 


13. 假定 采用 相对 寻 址 方式 的 转移 指令 占 两 个 字 节 ,第 一 字 节 是 操作 码 , 第 二 字 节 是 相 
对 位 移 量 (用 补 码 表示 )。 取 指令 时 ,每 次 CPU 从 存储 器 取出 一 个 字 节 ,并 自动 完成 
PC 十 1>PC. 假 设 执行 到 某 转移 指令 时 ( 取 指令 前 )PC 的 内 容 为 200CH, 该 指令 的 转移 目标 
地 址 为 1 FBOH, 则 该 转移 指令 第 二 字 节 的 内 容 应 为 (。”)。 
A. 5CH B. 5EH C. A2H D. A4H 


14. 假设 某 指令 的 一 个 操作 数 采 用 变 址 寻 址 方式 , 变 址 寄存 器 中 的 值 为 124, 指 令 中 给 
出 的 形式 地 址 为 B000H, 地 址 B000H 中 的 内 容 为 C000H, 则 该 操作 数 的 有 效 地 址 为 
EK 
A. B124H B. C1l24H C. B07CH D. Co7CH 
15. 假设 某 计 算 机 采用 小 端 方式 存储 , 按 字 节 编 址 。 一 维 数组 a 有 100 个 元 素 ,其 类 型 
为 float, 存 放 在 地 址 C000 1000H 开始 的 连续 区 域 中 , 则 最 后 一 个 数组 元 素 的 MSB 所 在 的 
地 址 应 为 (  )。 
A. C000 1396H B. C000 1399H  C. Co0o0118CH DD. C000 118FH 
16. 假设 某 条 指令 的 一 个 操作 数 采用 一 次 间接 寻 址 方式 ,指令 中 给 出 的 地 址 码 为 
1200H, 地 址 1200H 中 的 内 容 为 12FCH ,地址 12FCH 中 的 内 容 为 38B8H, 地 址 38B8H 中 
的 内 容 为 88F9H, 则 该 操作 数 的 有 效 地 址 为 (  )。 
A. 1200H B. 12FCH C. 38B8H D. 88F9H 
17. 假设 某 条 指令 的 一 个 操作 数 采用 寄存 器 间接 寻 址 方式 ,假定 指令 中 给 出 的 寄存 器 
编号 为 8,8 号 寄存 器 的 内 容 为 1200H ,地址 1200H 中 的 内 容 为 12FCH, 地 址 12FCH 中 的 
内 容 为 38B8H, 地 址 38B8H 中 的 内 容 为 88F9H, 则 该 操作 数 的 有 效 地 址 为 (””)。 
A. 1200H B. 12FCH C. 38B8H D. 88F9H 
18. 某 计算 机 按 字 节 编 址 ,采用 大 端 方式 存储 信息 。 其 中 , 某 指令 的 一 个 操作 数 的 机 器 
数 为 ABCD 00FFH ,该 操作 数 采用 基 址 寻 址 方式 ,指令 中 形式 地 址 (用 补 码 表示 ) 为 
FF00H ,当前 基 址 寄存 器 的 内 容 为 C000 0000H , 则 该 操作 数 的 LSB( 即 FFH) 存 放 的 地 址 是 
《 .外 
A. CO00 FFOOH B. CO00 FF03H  C. BFFF FF00H D. BFFF FF03H 
19. 某 计算 机 按 字 节 编 址 ,采用 小 端 方式 存储 信息 。 其 中 , 某 指令 的 一 个 操作 数 为 
16 位 ,该 操作 数 采用 基 址 寻 址 方式 ,指令 中 形式 地 址 (用 补 码 表示 ) 为 FF00H, 当 前 基 址 寄 
存 器 的 内 容 为 C000 0000H , 则 该 操作 数 的 MSB 存放 的 地 址 是 (””)。 
A. CO00 FF00H B. CO00 FFOIH CC. BFFF FF00H D. BFFF FF0IH 
20. 输入 输出 指令 的 功能 是 ( 。”)。 
A. 在 主 存 与 CPU 的 通用 寄存 器 之 间 进 行 数据 传送 
B. 在 主 存 和 I/O 端口 之 间 进 行 数据 传送 
C. 在 CPU 的 通用 寄存 器 和 I/O 端口 之 间 进 行 数据 传送 
D. 在 1/O 端口 和 IO 端口 之 间 进 行 数据 传送 
21. 通常 将 在 部 件 之 间 进 行 数据 传送 的 指令 称 为 传送 指令 。 以 下 有 关 各 类 传送 指令 功 
能 的 叙述 中 ,错误 的 是 ( )5 
A. 出 /入 栈 指 令 (push/pop) 完 成 CPU 和 栈 顶 之 间 的 数据 传送 
B. 访 存 指令 (load/store) 完 成 CPU 和 存储 单元 之 间 的 数据 传送 
C. I/O 指令 (in/out) 完 成 CPU 和 I/O 端口 之 间 的 数据 传送 
D. 寄存 器 传送 指令 (move) 完 成 CPU 和 寄存 器 之 间 的 数据 传送 
22. 下 列 有 关 RISC 特征 的 描述 中 ,错误 的 是 (。”)。 
A. 指令 格式 规整 , 寻 址 方式 少 B. 采用 硬 连 线 控制 和 指令 流水 线 
C. 配置 的 通用 寄存 器 数目 不 多 D. 运算 类 指令 的 操作 数 不 访 存 
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23. 假定 编译 器 对 C 源 程序 中 的 变量 和 MIPS 中 寄存 器 进行 了 以 下 对 应 : 变量 f 


启示 1 


和 j 分 别 分 配 到 寄存 器 $s0、$ sl1、$ s2、$ s3 和 $s4, 并 将 一 条 C 赋值 语句 编译 后 生成 如 下 


汇编 代码 序列 : 


请 问 这 条 C 赋值 语句 是 ( )。 
A. { 一 (g+iD 一 (h 十 ) B. f=(g+)—(h+i) 
C. {=(g+h)—(i+)) D. f=(i+)—(g+h) 
24. 以 下 有 关 调 用 指令 (转子 指令 ) 的 叙述 中 ,错误 的 是 ( 和 








A. 与 高 级 语言 源 程序 中 的 过 程 调用 相对 应 ,一 次 过 程 调 用 对 应 一 条 调用 指令 

B. 指令 执行 时 必须 保留 返回 地 址 ,调用 指令 随后 一 条 指令 的 地 址 是 返回 地 址 

C. 肉 套 调用 时 返回 地 址 通常 保存 在 栈 中 , 非 嵌 套 调用 时 可 保存 在 特定 寄存 器 中 
D. 指令 执行 时 将 无 条 件 转移 到 目标 地 址 处 ,转移 目标 地 址 无 需 在 指令 中 明显 给 出 


25. 栈 (stack) 是 一 块 采 用 ( ) 方 式 进行 数据 存 取 的 存储 区 ,在 大 多 数 系 
MIPS) 中 , 栈 位 于 高 端 地 址 空间 ,向 低地 址 方向 动态 增长 。 

A. 顺序 访问 B. 随机 访问 C. 先进 先 出 D. 先进 后 出 
26. 以 下 有 关 栈 (stack) 和 栈 帧 (stack frame) 的 叙述 中 ,错误 的 是 ( ss 

A. 栈 区 由 若干 个 栈 帧 组 成 ,每 个 栈 帧 对 应 一 个 过 程 或 子 程序 

B.CPU 中 必须 有 一 个 专门 的 栈 指针 寄存 器 ,用 来 存放 栈 顶 位 置 

C. 访 存 指令 不 能 访问 栈 中 信息 ,必须 提供 专门 的 入 栈 和 出 栈 指令 

D. 过 程 返 回 时 ,应 通过 修改 栈 指针 寄存 器 将 对 应 栈 帧 从 栈 中 退出 
【参考 答案 】 
0 ZZD 3B DD SB GC TB Sh Ee WB 
ID A SC WC DD IB iA BD WD 0 
2 Dr 2 2 D5 BD D6 
【部 分 题目 的 答案 解析 】 


统 ( 如 


1. CPU 在 执行 指令 时 ,会 根据 指令 中 的 操作 码 字 段 和 寻 址 方式 字段 对 寄存 器 中 的 内 
容 进行 解释 ,例如 ,若是 基 址 寻 址 方式 , 则 基 址 寄存 器 中 的 内 容 是 一 个 基地 址 ;若是 寄存 器 直 


接 寻 址 方式 , 则 寄存 器 中 的 内 容 是 操作 数 。 答 案 为 选项 C。 


2. 所 谓 操作 数 为 隐 含 指定 方式 ,是 指 操作 数 的 地 址 不 在 指令 中 明显 给 出 ,而 是 将 操作 
数 存放 在 一 个 默认 的 地 方 ,如 累加 器 中 。CPU 执行 指令 时 ,总 是 到 默认 的 特定 的 地 方 去 取 
操作 数 。 显 然 , 单 地址 双 目 运算 类 指令 中 的 一 个 操作 数 只 能 采用 隐 含 指定 方式 。 答 案 为 选 


项 D。 


3. 指令 长 度 为 16 位 ,每 个 地 址 码 占 4 位 ,对 于 三 地 址 指令 ,地 址 码 占 12 位 ,操作 码 占 


4 位 ,最 多 16 种 编码 ,15 条 指令 用 掉 15 种 编码 0000~~1110, 还 剩 一 种 编码 1111; 对 了 





址 指令 ,高 4 位 操作 码 一 定 是 1111 ,低位 的 地 址 码 占 8 位 , 剩 下 的 中 间 操 作 码 还 有 4 


F 二 地 
位 ,最 


多 可 以 有 16 种 编码 ,8 条 指令 用 掉 8 种 编码 1111 0 000~~1111 0 111; 对 于 一 地 址 指令 ,高 5 


位 操作 码 一 定 为 11111 , 低 4 位 为 地 址 码 , 剩 下 的 中 间 操 作 码 还 有 7 位 ,最 多 可 以 有 128 种 
编码 ,127 条 指令 用 掉 127 种 编码 11111 0000000~ 11111 1111110, 还 剩 一 种 编码 11111 
1111111 未 用 ;对 于 零 地 址 指令 ,其 高 12 位 操作 码 一 定 为 11111 1111111, 因 此 ,还 有 4 位 未 
编码 , 故 剩 下 的 零 地 址 指令 最 多 有 16 条 。 答 案 为 选项 B。 

5. 标志 寄存 器 用 来 存放 执行 指令 得 到 的 各 种 标志 等 信息 ,因此 ,标志 寄存 器 中 的 内 容 
通常 是 在 执行 指令 过 程 中 由 CPU 根据 指令 执行 结果 自动 生成 的 ,用 户 不 能 通过 指令 直接 
指定 标志 寄存 器 编号 来 修改 其 内 容 。 标 志 寄 存 器 一 般 是 专用 寄存 器 ,而 不 是 通用 寄存 器 , 因 
此 , 它 也 没有 编号 ,不 能 在 指令 中 直接 指定 其 编号 来 访问 它 ,也 即 不 是 用 户 可 见 寄存 器 。 标 
志 寄存 器 中 的 标志 位 主要 用 于 条 件 转移 或 条 件 设置 类 指令 中 的 条 件 判 断 。 

综 上 所 述 ,答案 为 选项 B。 

6. RR 型 指令 指 两 个 源 操作 数 和 目的 操作 数 都 在 寄存 器 中 ,RS 型 指令 指 一 个 源 操作 数 
在 寄存 器 , 另 一 个 源 操作 数 和 目的 操作 数 共用 同一 个 存储 单元 ,SS 型 指令 指 两 个 源 操作 数 
和 目的 操作 数 都 在 存储 单元 中 ,RI 型 指令 指 一 个 源 操作 数 是 立即 数 , 另 一 个 源 操作 数 和 目 
的 操作 数 都 在 寄存 器 中 。 显 然 ,SS 型 指令 需要 访问 存储 器 的 次 数 最 多 ,除了 取 指 令 需 要 访 
存 外 , 取 两 个 源 操作 数 和 存 结 果 都 要 访 存 。 因 此 ,SS 型 指令 的 执行 时 间 最 长 。 答 案 为 选 
项 C。 

12. 变 址 寻 址 方式 下 ,有 效 地 址 为 形式 地 址 加 上 变 址 值 , 变 址 值 存放 在 变 址 寄存 器 中 ， 
因此 , 变 址 寻 址 方式 的 有 效 地 址 为 RLX] 十 D。 答 案 为 选项 A。 

13. 相对 寻 址 方式 下 ,基准 地 址 为 PC 中 的 内 容 , 在 计算 转移 目标 地 址 时 ,CPU 已 经 从 
存储 器 中 取出 了 操作 码 和 相对 位 移 量 ,因此 ,PC 中 已 经 是 转移 指令 所 在 地 址 加 2 的 值 , 即 
200CH 十 2 二 200EH。 相 对 寻 址 方式 下 ,转移 目标 地 址 三 PC 十 位 移 量 ,因此 ,位 移 量 二 转移 
目标 地 址 一 PC=1FB0OH 一 200EH = 二 0001 1111 1011 0000 一 0010 0000 0000 1110==0001 
1111 1011 0000 十 1101 1111 1111 0010=1111 1111 1010 0010。 因 为 位 移 量 占 一 个 字 节 ,所 
以 ,在 指令 中 的 位 移 量 为 A2H。 运 算 时 位 移 量 扩展 8 位 , 即 FFA2H ,位 移 量 为 负数 。 答 案 
为 选项 C。 

14. 变 址 寻 址 方式 下 ,有 效 地 址 为 变 址 寄存 器 中 的 值 加 上 形式 地 址 , 变 址 值 124 二 111 
1100B= 二 7CH ,有效 地 址 为 B000H 十 007CH=B07CH。 答 案 为 选项 C。 

15. 数组 元 素 的 访问 通常 使 用 变 址 寻 址 方式 ,数组 起 始 地 址 通常 是 指令 中 直接 给 出 的 
形式 地 址 ,下 标 变量 存放 在 变 址 寄存 器 中 ,本 题 中 ,数组 元 素 类 型 为 float, 故 每 个 数组 元 素 
占 4 个 字 节 ,最 后 一 个 元 素 的 下 标 为 99, 其 首 地 址 为 C000 1000H 十 99X4 二 C000 1000H 十 
1 1000 1100B 二 C000 118CH。 因 为 采用 小 端 方式 并 按 字 节 编 址 ,所 以 MSB 所 在 的 地 址 应 
为 C000 118FH。 答 案 为 选项 D。 

16. 一 次 间接 寻 址 方式 下 ,指令 中 给 出 的 地 址 码 为 操作 数 的 有 效 地 址 的 地 址 ,所 以 , 操 
作 数 的 有 效 地 址 是 指令 中 地 址 码 所 指出 的 存储 单元 中 的 内 容 , 即 12FCH。 答 案 为 选项 B。 

17. 寄存 器 间接 寻 址 方式 下 ,操作 数 的 有 效 地 址 在 指令 中 给 出 的 寄存 器 中 ,因此 ,8 号 
寄存 器 中 的 内 容 为 操作 数 的 有 效 地 址 , 即 1200H。 答 案 为 选项 A。 

18. 基 址 寻 址 方式 下 ,操作 数 的 有 效 地 址 为 基 址 寄存 器 内 容 加 上 形式 地 址 ,因此 ,操作 
数 ABCD 00FFH 存放 在 C000 0000H 十 FF00H 二 C000 0000 十 FFFF FF00=BFFF FF00H。 
因为 是 大 端 方 式 并 按 字 节 编 址 ,所 以 LSB(FFH) 存 放 的 地 址 为 BFFF FF03H。 答案 为 选 
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项 D。 

19. 操作 数 的 地 址 与 第 18 题 一 样 ,也 是 BFFF FF00H。 因 为 计算 机 按 字 节 编 址 ,采用 
小 端 方式 , 且 操 作 数 为 16 位 , 占 两 个 字 节 ,因此 ,操作 数 的 MSB 存放 的 地 址 是 BFFF 
FF0O1H。 答 案 为 选项 D。 

21. 传送 指令 实现 在 部 件 之 间 进 行 数 据 传 送 , 这 里 的 部 件 一 定 是 能 够 存储 信息 的 部 件 ， 
选项 中 的 CPU 实际 上 是 指 CPU 中 的 寄存 器 。 对 于 选项 A, 出 /入 栈 指令 (push/pop) 实 现 
的 是 CPU 中 的 通用 寄存 器 和 栈 项 之 间 的 数据 传送 ;对 于 选项 B, 访 存 指令 (load/store) 完 成 
的 是 CPU 中 的 通用 寄存 器 和 存储 单元 之 间 的 数据 传送 ;对 于 选项 C,I/O 指令 (in/out) 完 成 
的 是 CPU 中 的 通用 寄存 器 和 1/O 端口 之 间 的 数据 传送 ;对 于 选项 D, 寄 存 器 传送 指令 
(move) 完 成 通用 寄存 器 和 通用 寄存 器 之 间 的 数据 传送 ,如 果 说 成 是 CPU 和 寄存 器 之 间 的 
数据 传送 , 则 意味 着 CPU 中 还 有 其 他 的 非 寄 存 器 部 件 能 存储 数据 ,显然 ,这 种 认识 是 错误 
的 。 答 案 为 选项 D。 

24. 调用 指令 (转子 指令 ) 主 要 用 于 子 程序 (过 程 或 函数 ) 调 用 ,例如 ,在 C 语言 程序 中 这 
到 一 个 函数 调用 时 ,编译 器 将 会 生成 一 条 调用 指令 。 为 了 能 保证 从 被 调用 过 程 返回 到 调用 
过 程 继续 执行 ,必须 确定 并 保存 返回 地 址 ,这 个 地 址 是 调用 指令 随后 的 指令 的 地 址 ,返回 地 
址 只 能 是 调用 指令 来 计算 并 保存 ,因为 执行 调用 指令 后 就 跳 转 到 了 被 调用 过 程 ,因此 无 法 获 
取 返 回 地 址 。 为 了 保证 嵌 套 调用 时 能 够 返回 到 调用 过 程 ,必须 将 返回 地 址 压 栈 , 如 果 不 压 栈 
而 保存 在 特定 寄存 器 , 则 后 面 执行 的 调用 指令 会 把 前 面 调用 指令 保存 的 返回 地 址 冲 掉 , 只 有 
调用 叶子 过 程 (叶子 过 程 将 不 再 有 新 的 过 程 调用 ,因此 是 非 嵌 套 调 用 ?时 的 调用 指令 可 以 把 
返回 地 址 存放 到 特定 寄存 器 中 。 调 用 指令 执行 时 将 无 条 件 转移 到 目标 地 址 处 ,这 个 目标 地 
址 就 是 被 调用 过 程 第 一 条 指令 的 地 址 , 它 一 定 在 调用 指令 中 明显 给 出 。 综 上 所 述 ,答案 为 选 
项 D。 

26. 栈 是 一 个 动态 存储 区 ,每 次 过 程 调用 都 会 生成 一 个 新 的 栈 帧 , 栈 顶 的 地 址 存放 在 一 
个 特定 的 栈 指针 寄存 器 中 ,可 以 使 用 专门 的 入 栈 和 出 栈 指令 来 访问 栈 顶 数据 ,也 可 以 通过 普 
通 的 访 存 指令 来 读 写 栈 帧 中 某 个 位 置 的 内 容 , 例 如 ,MIPS 架构 就 没有 专门 的 入 栈 和 出 栈 指 
令 , 只 能 通过 lw/sw 等 访 存 指令 进行 栈 中 信息 的 读 写 ;IA-32 架构 中 虽 有 专门 的 出 栈 和 入 栈 
指令 ,但 是 ,也 可 以 通过 MOV 指令 来 访问 栈 中 的 信息 。 当 一 个 过 程 执行 结束 时 ,总 是 要 通 
过 返回 指令 返回 到 它 的 调用 过 程 ,在 返回 到 调用 过 程 后 ,被 调用 过 程 对 应 的 栈 帧 必须 被 释放 
掉 , 通 常 通 过 修改 栈 项 位 置 来 实现 , 即 修改 栈 指针 寄存 器 的 内 容 。 综 上 所 述 ,答案 为 选项 C。 


4.6 分 析 应 用 题 


1. 以 下 哪 种 类 型 的 指令 执行 后 一 定 会 改变 程序 执行 顺序 ? 

条 件 转 移 指令 无 条 件 转 移 指令 、 调 用 指令 、 过 程 返 回 指令 、 自 陷 指令 ,中 断 返 回 指令 

【分 析 解 答 】 

给 出 的 几 种 指令 中 ,一 定 会 改变 程序 执行 顺序 的 指令 类 型 有 无 条 件 转移 指令 、 过 程 调 用 
指令 .过 程 返回 指令 . 自 陷 指令 ,中断 返回 指令 。 而 条 件 转移 指令 则 在 条 件 不 满足 时 顺序 执 
行 指令 。 


2. 某 计算 机 字 长 32 位 ,CPU 中 有 32 个 32 位 通用 寄存 器 ,采用 单字 长 定 长 指令 字 格 


~ 


式 ,操作 码 占 6 位 ,其 中 已 包含 对 寻 址 方式 的 指定 。 对 于 存储 器 直接 寻 址 方式 的 R-S 型 指 
令 , 能 直接 寻 址 的 最 大 地 址 空间 大 小 是 多 少 ? 对 于 采用 通用 寄存 器 作为 基 址 寄存 器 的 R-S 
型 指令 , 则 能 直接 寻 址 的 最 大 地 址 空间 大 小 是 多 少 ? 

【分 析 解 答 】 

因为 有 32 个 通用 寄存 器 ,所 以 寄存 器 编号 为 5 位。 存储 器 直接 寻 址 的 R-S 型 指令 的 一 
个 操作 数 在 寄存 器 中 ,所 以 指令 中 有 一 个 5 位 的 寄存 器 编号 ,另外 一 个 地 址 码 是 直接 地 址 ， 
共有 32 一 6 一 5 一 21 位 。 所 以 ,能 直接 寻 址 的 最 大 地 址 空间 大 小 是 22 个 字 。 

基 址 寻 址 的 R-S 型 指令 的 一 个 操作 数 在 寄存 器 中 , 另 一 个 操作 数 在 基 址 寻 址 的 存储 单 
元 中 ,因为 采用 通用 寄存 器 作为 基 址 寄存 器 ,所 以 必须 在 指令 中 明显 指出 基 址 寄存 器 是 哪个 
通用 寄存 器 ,所 以 基 址 寄存 器 的 编号 占 5 位 , 剩 下 的 位 数 (32 一 6 一 5 一 5=16 位 ) 是 位 移 量 。 
通用 寄存 器 的 位 数 是 32 位 ,所 以 基 址 寄存 器 中 的 基准 地 址 位 数 是 32 位 。 一 个 32 位 的 数 加 
上 一 个 6 位 的 数 ,其 结果 还 是 一 个 32 位 的 数 。 所 以 ,能 直接 寻 址 的 最 大 地 址 空间 大 小 是 
22 个 字 。 

3. 若 采用 相对 寻 址 方式 的 转移 指令 占 两 个 字 节 , 第 一 字 节 是 操作 码 ,第 二 字 节 是 相对 
位 移 量 (用 补 码 表示 )。CPU 在 执行 指令 时 ,每 次 CPU 从 存储 器 取出 一 个 字 节 ,并 自动 完成 
PC 十 1>PC。 假 设 执行 到 该 转移 指令 时 PC 的 内 容 为 200AH, 如果 要 求 转移 到 2000H, 则 
该 转移 指令 第 二 字 节 的 内 容 应 为 多 少 ? 

【分 析 解 答 】 

执行 到 该 转移 指令 时 PC 的 内 容 为 200AH, 因 此 ,在 CPU 取 指令 过 程 中 ,取出 第 一 字 
节 的 操作 码 后 ,PC 的 内 容 为 200BH ,取出 第 二 字 节 的 位 移 量 后 ,PC 的 内 容 为 200CH ,因此 ， 
在 执行 该 转移 指令 计算 转移 目标 地 址 时 ,PC 已 经 是 200CH 了 。 因 为 转移 目标 地 址 为 
2000H ,所 以 ,此 时 位 移 量 是 2000H 一 200CH= 一 0CH, 用 补 码 表示 为 100H 一 0OCH=F4H。 

4. 某 指令 系统 的 指令 字 是 16 位 ,每 个 地 址 码 为 6 位 。 若 二 地 址 指令 15 条 ,一 地 址 指 
令 48 条 , 则 剩 下 的 零 地 址 指令 最 多 有 多 少 条 ? 

【分 析 解 答 】 

操作 码 按 短 到 长 进行 扩展 编码 。 对 于 二 地 址 指令 ,两 个 地 址 码 占 12 位 , 剩 下 的 操作 码 
占 4 位 ,最 多 有 16 种 编码 ,15 条 指令 用 掉 15 种 编码 0000 一 1110 ,还 剩 一 种 编码 1111; 对 于 
一 地 址 指令 ,高 4 位 操作 码 一 定 是 1111, 最 低 6 位 是 一 个 地 址 码 , 剩 下 的 中 间 操 作 码 还 有 
6 位 ,最 多 可 以 有 64 种 编码 ,指令 条 数 是 48, 因 此 只 需 从 64 种 编码 中 选 48 种 作为 48 条 指 
令 的 操作 码 。 可 采用 如 下 的 操作 码 编码 方案 : 1111 0 00000~1111 0 11111( 共 32 种 编码 ) 、 
1111 1 0 0000~1111 10 1111( 共 16 种 编码 ); 对 于 零 地 址 指令 ,其 高 10 位 操作 码 的 编码 空 
间 为 1111 1 1 0000~1111111111, 因 此 ,高 10 位 共有 16 种 编码 可 用 ,再 加 上 低 6 位 的 
64 种 编码 ,一共 可 组 合成 16X64 王 1024 种 编码 ,可 以 分 别 分 配给 1024 种 指令 。 故 剩 下 的 
零 地 址 指令 最 多 有 1024 条 。 

5. 某 计算 机 指令 系统 采用 定 长 指令 字 格式 ,指令 字 长 16 位 ,每 个 操作 数 的 地 址 码 长 
6 位 。 指 令 分 二 地 址 . 单 地 址 和 零 地 址 三 类 。 若 二 地 址 指令 有 心 条 ,无 地 址 指令 有 A 条 , 则 
单 地 址 指令 最 多 有 多 少 条 ? 

【分 析 解 答 】 

设 单 地 址 指令 有 条 , 则 ((16 一 局 ) X25 一 &) X25 二 ko, ki 二 (16 一 ks) X25 一 ko/25。 
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6. 假设 某 计算 机 按 字 节 编 址 ,采用 小 端 方式 存储 信息 。 其 中 某 指令 的 操作 数 为 32 位 
字 , 采 用 基 址 寻 址 方式 , 若 指令 中 形式 地 址 (用 补 码 表示 ) 为 B000H ,当前 基 址 寄存 器 的 内 容 
为 8000 4000H , 则 该 指令 的 操作 数 地 址 为 多 少 ? 若 该 操作 数 的 机 器 码 为 1234 5678H, 则 该 
操作 数 的 4 个 字 节 12H.34H,.56H 和 78H 的 存放 地 址 分 别 是 什么 ? 

【分 析 解 答 】 

B000H 二 1011 0000 0000 0000B, 形 式 地 址 的 值 为 一 101 0000 0000 0000B= 一 5000H， 
因此 操作 数 的 有 效 地 址 为 8000 4000H 一 5000H 二 7FFF F000H。 小 端 方式 下 ,LSB 的 地 址 
为 操作 数 地 址 , 即 书写 顺序 与 存储 顺序 相反 ,因而 12H、34H、56H 和 78H 的 存放 地 址 分 别 
是 7FFF F003H、7FFF F002H、7FFF F001H 和 7FFF F000H。 

7. 一 次 间接 寻 址 指令 中 给 出 的 地 址 码 为 2000H ,地址 为 2000H 的 内 存单 元 中 的 内 容 
为 3000H ,地 址 为 3000H 的 内 存单 元 的 内 容 为 4000H, 而 4000H 单元 的 内 容 为 5000H, 则 
该 操作 数 的 有 效 地 址 是 多 少 ? 该 操作 数 的 值 是 多 少 ? 

【分 析 解 答 】 

一 次 间接 寻 址 方式 的 指令 中 给 出 的 地 址 码 是 一 个 间接 地 址 , 即 操作 数 地 址 的 地 址 。 所 
以 ,操作 数 的 有 效 地 址 应 该 是 地 址 码 2000H 中 的 内 容 , 即 3000H; 有 效 地 址 所 指出 的 内 存单 
元 的 内 容 是 操作 数 , 即 4000H 是 操作 数 。 

8. 假设 地 址 为 1200H 的 内 存单 元 中 的 内 容 为 120CH ,地 址 为 120CH 的 内 存单 元 的 内 
容 为 38B8H, 而 38B8H 单元 的 内 容 为 88F9H。 说 明 以 下 各 情况 下 操作 数 的 有 效 地 址 和 操 
作 数 各 是 多 少 。 

(1) 操作 数 采用 变 址 寻 址 , 变 址 寄存 器 中 存放 内 容 的 值 为 12 ,指令 中 给 出 的 形式 地 址 为 
1200H。 

(2) 操作 数 采用 一 次 间接 寻 址 ,指令 中 给 出 的 地 址 码 为 120CH。 

(3) 操作 数 采用 寄存 器 间接 寻 址 ,指令 中 给 出 的 寄存 器 编号 为 8,8 号 寄存 器 的 内 容 
为 1200H。 

【分 析 解 答 】 

(1) 有 效 地 址 为 000CH 十 1200H=120CH ,操作 数 为 38B8H。 

(2) 有 效 地 址 为 38B8H ,操作 数 为 88F9H。 

(3) 有 效 地 址 为 1200H ,操作 数 为 120CH。 

9. 某 计算 机 字 长 为 16 位 ,存储 器 存 取 宽度 为 16 位 , 即 每 次 从 存储 器 取出 16 位 。CPU 
中 有 8 个 16 位 通用 寄存 器 。 现 为 该 机 设计 指令 系统 ,要 求 指令 长 度 为 字 长 的 整数 倍 ,至 多 
支持 64 种 不 同 操作 ,每 个 操作 数 都 支持 4 种 寻 址 方式 : 立即 (D ,寄存 器 直接 (R) ,寄存 器 间 
接 (S) 和 变 址 (X) 寻 址 方式 。 存储器 地 址 位 数 和 立即 数 均 为 16 位 ,任何 一 个 通用 寄存 器 都 
可 作 变 址 寄存 器 ,支持 以 下 7 种 二 地 址 指令 格式 (R、I、S、X 代表 上 述 4 种 寻 址 方式 ): 
RR 型 \.RI 型 .RS 型 .RX 型 .XI 型 .SI 型 .SS 型 。 请 设计 该 指令 系统 的 7 种 指令 格式 ,给 出 
每 种 格式 的 指令 长 度 、 各 字段 所 占 位 数 和 含义 ,并 说 明 每 种 格式 指令 的 功能 以 及 需要 的 访 存 
次 数 。 

【分 析 解 答 】 

因为 至 多 有 64 种 操作 ,所 以 操作 码 字 段 只 需要 6 位 ;有 8 个 通用 寄存 器 ,所 以 寄存 器 编 
号 至 少 占 3 位 ; 寻 址 方式 有 4 种 ,所 以 寻 址 方式 位 至 少 占 2 位 ;直接 地 址 和 立即 数 都 是 


16 位 ;任何 通用 寄存 器 都 可 作 变 址 寄存 器 ,所 以 指令 中 要 明显 指定 变 址 寄存 器 ,其 编号 占 
3 位 ;指令 总 位 数 是 16 的 倍数 。 此 外 ,指令 格式 应 尽量 规整 ,指令 长 度 应 尽量 短 。 按 照 上 述 
要 求 设计 出 的 指令 格式 可 以 有 很 多 种 。 以 下 是 采用 二 地 址 指令 格式 的 两 种 指令 格式 设计 方 
案 ,RI、XI 和 SI 三 种 指令 格式 中 添 了 3 个 0, 是 为 了 补足 位 数 ,以 使 指令 长 度 为 16 的 倍数 。 
这 两 种 方案 得 到 的 RR、RS 和 SS 型 指令 都 是 16 位 ,RI、RX 和 SI 型 指令 都 是 32 位 ,XI 型 指 
令 是 48 位 。 

指令 格式 示例 1: 如 图 4. 1 所 示 ,用 专门 的 “类 型 ?字段 (最 左边 4 位 ) 说 明 不 同 的 指令 类 
型 ,无 须 对 两 个 操作 数 的 寻 址 方式 分 别 说 明 。7 种 指令 类 型 只 要 3 位 编码 即 可 ,所 以 最 后 一 
位 总 是 0。 
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RR 型 | 0000 | OP (6 位 ) | Rt(3 位 )| Rs (3 位 ) 








RI 型 | 0010 | OP(6 位 ) | Rt(G3 位 )| 000 | Imm16 (16 位 ) 








RS 型 | 0100 | OP (6 位 ) | Rt(G3 位 )| Rs (3 位 ) 








RX 型 | 0110 | OP (6 位 ) | RtG3 位 )| Rx (3 位 )| Offset16 (16 位 ) 








XI 型 | 1000 | OP(6 位 ) |Rx (3 位) 000 | Offset16 (16 位 ) | Imm16 (16 位 ) 














SI 型 | 1010 | OP(6 位 ) |Rt(3 位 ) 000 | Imml16(16 位 ) 























SS 型 | 1100 | OP (6 位) | Rt(3 位 )| Rs (3 位 ) 


4.1 第 一 种 指令 格式 示例 





指令 格式 示例 2: 如 图 4. 2 所 示 , 用 专门 的 * 寻 址 方式 ”字段 分 别 说 明 两 个 操作 数 的 寻 址 
方式 。 其 定义 为 : 00 一 立即 ;01 一 寄 直 ;10 一 寄 间 ;11 一 变 址 。 








RR 型 | OP(6 位 )| 01 | 0 


Rt(3 位 )| Rs (3 位 ) 








RI 型 ”| OP (6 位 ) | 01 | 00 |Rt(3 位 )| 000 | Imm16 (16 位 ) 


Ss 








RS 型 |OP(6 位 )| 01 | 1 


三 


Rt (3 位 )| Rs (3 位 ) 








RX 型 |OP(6 位 ) | 01 | 1 


Rt (3 位 )| Rx (3 位 )| Offset16 (16 位 ) 








XI 型 | OP (6 位 ) | 11 | 00 |Rx (3 位 ) ”000 | Offset16 (16 位 ) | Imm16 (16 位 ) 











SI 型 ”| OP (6 位 ) | 10 | 00 | Rt(G3 位 )| ”000 | Imm16 (16 位 ) 





























SS 型 | OP (6 位 ) | 10 | 10 | RtG3 位 )| Rs (3 位 ) 


4.2 第 二 种 指令 格式 示例 





存储 器 存 取 宽度 为 16 位 ,每 次 从 存储 器 取出 16 位 。 因 此 , 读 取 16、32 和 48 位 指令 分 
别 需要 1.2 和 3 次 存储 器 访问 。 各 类 指令 的 功能 和 访 存 次 数 分 别 说 明 如 下 (MLxj 表 示 存 储 
器 地 址 x 中 的 内 容 ,R[Lxj 表 示 寄 存 器 x 中 的 内 容 ) 。 

RR 型 指令 功能 为 RLRt]<-R[LRt] op RLRs], 取 指令 时 访 存 1 次 ;RI 型 指令 功能 为 
R[Rt]<R[Rt] op Imm16, 取 指令 时 访 存 2 次 ;RS 型 指令 功能 为 R[Rt]<R[Rt] op 
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MLRLRs]], 取 指令 和 取 第 2 个 源 操作 数 各 访 存 1 次 , 共 访 存 2 次 ;RX 型 指令 功能 为 RERt 一 
R[Rt] op MLR[Rx] 十 Offset], 取 指令 访 存 2 次 , 取 第 2 个 源 操作 数 访 存 1 次 , 共 访 存 3 次 ; 
XI 型 功能 为 MLRLRxj] 十 Offset]<-M[R[Rxj 十 Offset] op Imm16, 取 指令 访 存 3 次 , 取 第 
一 个 源 操作 数 访 存 1 次 , 写 结果 访 存 1 次 , 共 访 存 5 次 ;SI 型 指令 功能 为 MLRLRt] 一 
MLR[Rt]] op Imm16, 取 指令 访 存 2 次 , 取 第 一 个 源 操 作 数 和 写 结 果 各 访 存 1 次 , 共 访 存 4 
次 ;SS 型 功能 为 M[R[RtJ]<-M[RLRt]] op MLRLRs]], 取 指令 访 存 1 次 , 取 第 一 个 源 操作 
数 、 取 第 二 个 源 操作 数 和 写 结果 各 访 存 1 次 , 共 访 存 4 次 。 

10. 某 计算 机 字 长 为 16 位 , 主 存 地 址 空间 大 小 为 128KB, 按 字 编 址 。 采 用 单字 长 定 长 
指令 格式 ,指令 各 字段 定义 如 下 : 
15 12 11 6 5 0 

OP Ms 1 Rs Md |! Rd | 

源 操作 数 目的 操作 数 

转移 指令 采用 相对 寻 址 方式 ,相对 偏 移 量 用 补 码 表示 。 寻 址 方式 定义 如 表 4. 1 所 示 。 


表 4.1 题 10 中 定义 的 寻 址 方式 及 其 含义 






































Ms/Md 寻 址 方式 助 记 符 4 
000B 寄存 器 直接 Rn 操作 数 一 RLRn] 
001B 寄存 器 间接 (Rn) 操作 数 =M[R[Rnm]] 
010B 寄存 器 间接 、 自 增 (Rn) 十 操作 数 =M[R[Rn]]，R[Rn]<-R[Ro] 十 1 
011B 相对 D(Rn) 转移 目标 地 址 =PC 十 RLRn] 
注 ; M[x] 表 示 存储 器 地 址 x 中 的 内 容 ,R[x] 表 示 寄存 器 x 中 的 内 容 
请 回答 下 列 问题 


(1) 该 指令 系统 最 多 可 有 多 少 条 指令 ? 该 计算 机 最 多 有 多 少 个 通用 寄存 器 ? 存储 器 地 
址 寄存 器 (MAR) 和 存储 器 数据 寄存 器 (MDR) 至 少 各 需要 多 少 位 ? 

(2) 转移 指令 的 目标 地 址 范围 是 多 少 ? 

(3) 若 操 作 码 0010B 表示 加 法 操作 ( 助 记 符 为 add) ,寄存 器 R4 和 R5 的 编号 分 别 为 
100B 和 101B,R4 的 内 容 为 1234H,R5 的 内 容 为 5678HH, 地 址 1234H 中 的 内 容 为 5678H， 
地 址 5678H 中 的 内 容 为 1234H, 则 汇编 语句 “add(R4),(R5) 十 ”( 逗 号 前 为 第 一 源 操作 数 ， 
逗号 后 为 第 二 源 操 作 数 和 目的 操作 数 ) 对 应 的 机 器 码 是 什么 (用 十 六 进 制 表示 )? 该 指令 执 
行 后 ,哪些 寄存 器 和 存储 单元 的 内 容 会 改变 ? 改变 后 的 内 容 是 什么 ? 

【分 析 解 答 】 

(1) 因为 采用 单字 长 指令 格式 ,操作 码 字 段 占 4 位 ,所 以 最 多 有 16 条 指令 ;指令 中 通用 
寄存 器 编号 占 3 位 ,所 以 ,最 多 有 8 个 通用 寄存 器 ;因为 地 址 空间 大 小 为 128KB, 按 字 编 址 ， 
故 共有 64K 个 存储 单元 ,因而 地 址 位 数 为 16 位 ,所 以 MAR 至 少 为 16 位 ;因为 字 长 为 
16 位 ,所 以 MDR 至 少 为 16 位 。 

(2) 因为 地 址 位 数 和 字 长 都 为 16 位 ,所 以 PC 和 通用 寄存 器 位 数 均 为 16 位 ,两 个 16 位 
数据 相 加 其 结果 也 为 16 位 , 即 转移 目标 地 址 位 数 为 16 位 ,因而 能 在 整个 地 址 空间 转移 , 即 
目标 转移 地 址 的 范围 为 0000H~FFFFH。 


(3) 要 得 到 汇编 语句 “add(R4),(R5) 十 ?对 应 的 机 器 码 , 只 要 将 其 对 应 的 指令 代码 各 个 
字段 拼接 起 来 即 可 。 显 然 ,add 对 应 op 字段 ,为 0010B;(R4) 的 寻 址 方式 字段 为 001B,R4 的 
编号 为 100B;(R5) 十 的 寻 址 方式 字段 为 010B,R5 的 编号 为 101B; 因此 ,对 应 的 机 器 码 为 
0010 001 100 010 101B, 用 十 六 进 制 表示 为 2315H。 指 令 “add(R4),(R5) 十 ”的 功能 为 , M 
[R5]<-MLRLR5]] 十 MLRLR4]],RLR5]<-RLR5] 十 1。 已 知 RLR4]=1234H，R[R5] = 
5678H,M[1234H]=5678H,M[5678H]=1234H, 因 为 1234H 十 5678H 二 68ACH, 所 以 
5678H 单元 中 的 内 容 从 1234H 改变 为 68ACH ,同时 R5 中 的 内 容 从 5678H 变 为 5679H。 

11. 假定 A 是 一 个 32 位 的 地 址 ,A_upper 和 A_lower 分 别 表 示 地 址 A 的 高 . 低 16 位， 
以 下 MIPS 指令 代码 用 来 将 存放 在 存储 器 地 址 A 处 的 机 器 数 读 和 人 寄存 器 $s0 中 。 


lui $t0, A upper 将 A upper 的 低位 添加 16 个 0, 送 $t0 
ori S$t0, $t0, A lower # 将 A_lower 的 高 位 扩展 0 后 与 $t0 的 内 容 相 " 或 ", 送 $t0 
lw $s0, 0($t0) # 将 $t0 的 内 容 和 0 相 加 得 到 有 效 地 址 ,从 中 取 数 送 $ s0 


上 述 功能 也 能 用 以 下 两 条 MIPS 指令 来 实现 。 请 问 第 一 条 指令 中 A_upper_adjusted 
的 值 如 何 得 到 ? 
lui S$t0, A upper adjusted 


lw $s0, A lower($t0) # 将 A_lower 进行 符号 扩展 后 ,和 $t0 的 内 容 相 加 ,得 到 有 效 
# 地 址 ,从 中 取 数 送 $s0 


【分 析 解答 】 

因为 MIPS 指令 中 的 立即 数 都 只 能 是 16 位 ,所 以 一 个 32 位 的 地 址 无 法 直接 传送 到 一 
个 32 位 寄存 器 中 。 第 一 种 实现 方案 是 通过 将 地 址 A 的 高 16 位 和 低 16 位 分 别 作为 两 条 指 
令 的 立即 数 , 将 它们 用 或 操作 合并 到 一 个 32 位 寄存 器 。 这 样 ,第 三 条 取 数 指令 lw 的 偏 移 量 
就 是 0。 第 二 种 方案 中 取 数 指令 lw 的 偏 移 量 是 A 的 低位 部 分 A_lower, 由 于 取 数 指令 lw 
在 计算 内 存单 元 地 址 时 对 偏 移 量 采用 的 是 符号 扩展 ,所 以 要 使 得 高 16 位 最 终 的 结果 为 
A_upper, 必 须 对 A_upper 进行 以 下 调整 : 若 A_lower 的 最 高 位 (看 成 是 低 16 位 数 的 符号 
位 ) 是 0, 则 A_upper_adjusted 二 A_upper, 这 样 ,A_lower 符号 扩展 后 高 16 位 为 全 0, 和 高 
16 位 A_upper 相 加 后 ,高 16 位 还 是 A_upper; 若 A_lower 的 最 高 位 是 1, 则 A_lower 符号 
扩展 后 高 16 位 为 全 1, 此 时 ,A_upper_adjusted 应 满足 : FFFFH 十 A_upper_adjusted 一 
A_upper。 而 因为 FFFFH 十 A_upper 十 1 二 A_upper( 最 高 位 向 前 面 的 进位 被 丢弃 ), 所 以 ， 
A_upper _adjusted=A_upper 二 1。 

12. 除了 硬件 乘法 器 外 ,还 可 以 用 移 位 和 加 法 指令 来 实现 乘法 运算 。 在 乘 以 较 小 的 常 
数 时 ,这 种 办 法 很 有 效 。 在 不 考虑 溢出 的 情况 下 ,假设 要 将 $s0 的 内 容 与 6 相 乘 ,乘积 存 人 
$ sl 中 。 请 写 出 一 段 指令 条 数 最 少 且 不 包括 乘法 指令 的 MIPS 代码 。 

【分 析 解 答 】 

一 个 数 z 乘 以 6, 相 当 于 4z 十 2z, 而 4z 可 以 通过 将 z 左 移 两 位 来 实现 ,2z 可 以 通过 将 
工 左 移 一 位 来 实现 。 这 样 就 只 要 用 两 条 左 移 指令 和 一 条 加 法 指令 来 实现 乘 6 操作 。 以 此 类 
推 , 当 乘 以 一 个 较 小 的 常数 时 ,只 要 将 这 个 较 小 的 常数 分 解 成 若干 个 2 的 宕 次 相 加 ,就 可 以 
用 若干 条 左 移 指令 和 一 条 加 法 指令 来 实现 乘法 运算 。 可 用 以 下 指令 序列 实现 题目 要 求 。 


sll $sl, $s0, 2 皇 $s0 的 内 容 左 移 两 位 , 送 $ sl 
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sll $s0, $s0, 1 # 将 $s0 的 内 容 左 移 一 位 , 送 $s0 

addu $sl, $sl, $s0 纤 $sl 和 $s0 的 内 容 相 加 (不 考虑 溢出 ), 送 $ si 

13. 有 些 计算 机 提供 了 专门 的 指令 ,能 从 32 位 寄存 器 中 抽取 其 中 任意 一 个 位 串 置 于 另 
一 个 寄存 器 的 低位 有 效 位 上 ,并 高 位 补 0, 如 图 4. 3 所 示 。MIPS 指令 系统 中 没有 这 样 的 指 
令 , 请 写 出 最 短 的 一 个 MIPS 指令 序列 来 实现 这 个 功能 ,要 求 ;一 5, 7 一 22, 操作 前 后 的 寄存 
器 分 别 为 $s0 和 $s2。 


31 次 i 0 


(31 汉 位 (位 (+]) 位 
31 0 


0 本 000| 
(32-( 广 门 位 (0D 位 
4.3 题 13 中 操作 前 后 示意 图 


























【分 析 解 答 】 

可 以 先 左 移 9 位 ,然后 右 移 15 位 ,MIPS 指令 序列 为 : 

sll $s2, $s0, 9 4 将 $s0 的 内 容 左 移 9 位 , 送 $s2 
srl $s2, $s2, 15 4 将 $s2 的 内 容 右 移 15 位 , 送 $s2 


这 里 要 注意 ,第 二 条 指令 不 能 用 算术 右 移 指令 sra, 因 为 算术 右 移 高 位 添加 的 是 符号 ,所 
以 ,不 能 保证 高 位 一 定 补 0。 此 外 ,第 一 条 指令 中 的 目的 操作 数 寄存 器 和 第 二 条 指令 的 源 操 
作 数 寄存 器 都 只 能 用 $s2, 而 不 能 改 成 其 他 寄存 器 ,否则 ,会 破坏 其 他 寄存 器 的 值 ! 

14. 以 下 程序 段 是 某 个 过 程 对 应 的 指令 序列 。 入 口 参 数 int a 和 int b 分 别 置 于 $a0 和 
$al 中 ,返回 参数 是 该 过 程 的 结果 , 置 于 $ v0 中 。 要 求 为 以 下 MIPS 指令 序列 加 注释 ,并 简 
单 说 明 该 过 程 的 功能 。 


add $t0, S$zero, $zero 
loop: beq $al, S$zero, finish 
add S$t0, S$t0, $a0 
sub $al, S$al, 1 
| loop 
finish: addi $t0, S$t0, 100 
add $v0, S$t0, $zero 


【分 析 解 答 】 
add S$t0, S$zero, $zero 4 将 寄存 器 St0 置 0 

loop: beq $al, S$zero, finish # 若 $al 的 值 等 于 0, 则 转 finish 处 
add St0， $t0, $a0 乒 $t0 和 $a0 的 内 容 相 加 , 送 $t0 
sub $al, S$al, 1 乒 $al 的 值 减 1 
j loop # 无 条 件 转 到 loop 处 

finish: addi St0， $t0, 100 乒 $t0 的 内 容 加 100 


add Sv0， $t0, $zero 乒 $t0 的 内 容 送 $v0 


该 过 程 的 功能 是 计算 axXb 十 100。 

15. 用 一 条 MIPS 指令 或 最 短 的 指令 序列 实现 以 下 C 语言 语句 : b=25|a。 假 定编 译 
器 将 a 和 bb 分 别 分 配 到 $t0 和 $tl 中 。 如 果 把 25 换 成 65536, 即 b 王 65536|a, 则 用 MIPS 
指令 或 指令 序列 如 何 实现 ? 

【分 析 解 答 】 

只 要 用 一 条 指令 "ori $tl，$t0,， 25” 就 可 实现 b=25|a。 但 是 ,如 果 把 25 换 成 65536， 
则 不 能 用 一 条 指令 “ori $t1，$ t0, 65536” 来 实现 ,因为 65536 王 1 0000 0000 0000 0000B， 
它 不 能 用 16 位 立即 数 表示 。 可 用 以 下 两 条 指令 实现 b==65536|a。 


i #4 将 0001 0000H 置 于 寄存 器 $t1 
or S$tl, $t0, $tl 皇 $t0 和 $ tl 的 内 容 进行 "或 "运算 , 送 $t1 


16. 请 说 明 beq 指令 的 跳 转 范围 ,并 解释 为 什么 汇编 程序 在 对 下 列 MIPS 汇编 源 程序 
中 的 beq 指令 进行 汇编 时 会 遇 到 问题 ,应 该 如 何 修改 该 程序 段 ? 


here: beq $s0, $s2, there 


there: addi $sl, $s0, 4 


【分 析 解 答 】 

在 MIPS 指令 系统 中 ,分 支 指令 beq 是 工 型 指令 ,转移 目标 地 址 采用 相对 寻 址 方式 ， 
16 位 偏 移 量 offset 用 补 码 表示 ,因此 可 以 跳 转 到 当前 指令 前 ,也 可 以 跳 转 到 当前 指令 后 。 
其 转移 目标 地 址 的 计算 公式 为 PC 十 4 十 offsetX4。 因 此 , 当 offset 的 范围 为 0000 0000 0000 
0000B~0111 1111 1111 1111B 时 ,beq 指令 向 后 正 跳 , 相 对 于 本 条 指令 ,向 后 正 跳 1 一 2 条 
指令 ,其 跳 转 地 址 范围 为 4 一 4 十 (25 一 1)X4=27。 当 offset 的 范围 为 1000 0000 0000 
0000B~1111 1111 1111 1111B 时 ,beq 指令 向 前 负 跳 ,相对 于 本 条 指令 ,向 前 负 跳 1~2” 一 1 
条 指令 ,其 跳 转 地 址 范围 为 一 4X (2 一 1)~ 一 4。 

当 上 述 指令 序列 中 here 和 there 表示 的 地 址 相差 超过 上 述 给 定 范围 时 ,beq 指令 会 发 
生 汇 编 错误 。 可 将 上 述 指令 序列 改 成 以 下 指令 序列 。 因 为 无 条 件 跳 转 指令 j 的 跳 转 范围 足 
够 大 ,所 以 可 以 直接 从 here 跳 转 到 there。 





here: bne $s0, $s2, skip 
| there 


skip: 


there: addi $sl, $s0, 4 


17. 下 列 指令 序列 是 一 个 完整 的 过 程 ,用 来 对 两 个 数组 进行 处 理 ,并 产生 结果 存放 在 
$ v0 中 。 假 定 每 个 数组 有 2500 个 元 素 , 下 标 变量 为 mnt 类 型 。 两 个 数组 的 首 地 址 分 别 存放 
在 $a0 和 $al 中 ,数组 长 度 分 别 存放 在 $a2 和 $a3 中 。 根 据 注释 简单 说 明 该 过 程 的 功能 。 
假定 该 过 程 运行 在 一 个 时 钟 频率 为 2GHz 的 处 理 器 上 ,add、addi 和 sll 指令 的 CPI 为 1;lw 
和 bne 指令 的 CPI 为 2, 则 最 坏 情况 下 运行 该 过 程 所 需 的 时 间 是 多 少 秒 ? 

sl1 $a2, $a2, 2 #9a2 的 内 容 左 移 2 位 , 即 乘 4 
EE 到 4S$a3 的 内 容 左 移 2 位 , 即 乘 4 


才 全 如 
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add $v0, S$zero, $zero #S$Sv0 初 始 化 为 0 
add $t0, S$zero, $zero #S$St0 初 始 化 为 0 
outer: add S$t4, $a0， $t0 # 计 算数 组 1 当前 元 素 的 地 址 
lw S$t4, 0($t4) 拷 组 1 当前 元 素 存 放 在 $t4 
add $tl, S$zero, $zero #S$Stl 初 始 化 为 0 
inner: add S$t3, S$al, S$tl # 计 算数 组 2 当前 元 素 的 地 址 
lw S$t3, 0($t3) 绕组 2 当前 元 素 存放 在 $t3 
bne $t3, $t4, skip #$t3 和 $t4 的 内 容 不 相等 , 则 转 skip 
addi $v0, $v0， 1 #v0 加 1 
skip: addi $tl, Stl， 4 #Stl 加 4 
bne $tl, $a3， inner 引 组 2 未 处 理 完 ,继续 转 inner 执行 
addi $t0, $t0, 4 #$t0 加 4 
bne $t0, $a2, outer 引 组 1 未 处 理 完 ,继续 转 outer 执行 
【分 析 解 答 】 


该 过 程 的 功能 是 统计 两 个 数组 中 相同 元 素 的 个 数 ,多 次 相等 则 重复 计数 。 过 程 执行 时 
最 坏 的 情况 是 两 个 数组 的 所 有 元 素 都 相等 ,这 样 ,指令 “addi $ v0，$ v0, 1” 在 每 次 循环 中 
都 被 执行 。 因 为 add、addi 和 sll 指令 的 CPI 为 1,lw 和 bne 指令 的 CPI 为 2, 所 以 ,在 最 坏 情 
况 下 所 需 的 时 钟 周期 总 数 为 {4 十 [4 十 (6 十 3) X2500 十 3] X2500) 三 56267506, 时 钟 周期 为 
1/2GHz=0. 5ns, 因 此 ,执行 该 过 程 的 总 执行 时 间 最 多 为 56267506 X0. 5ns 王 28133753nss* 
0.028s。 

18. 以 下 程序 段 是 某 个 过 程 对 应 的 MIPS 指令 序列 ,其 功能 为 复制 一 个 存储 块 数据 到 
另 一 个 存储 块 中 ,存储 块 中 每 个 数据 的 类 型 为 float, 源 数据 块 和 目的 数据 块 的 首 地 址 分 别 
存放 在 $a0 和 $al 中 ,复制 的 数据 个 数 存放 在 $ v0 中 ,作为 返回 参数 返回 给 调用 过 程 。 在 
复制 过 程 中 遇 到 0 则 停止 ,最 后 一 个 0 也 需要 复制 ,但 不 被 计数 。 已 知 该 程序 段 中 有 多 个 
Bug, 请 找 出 它们 并 修改 之 。 


addi $v0, S$zero, 0 
loop: lw $vl, 0($a0) 

sw $vl, 0($al) 

addi $a0, S$a0, 4 

addi $al, S$al, 4 

beq S$vl, S$zero, loop 


【分 析 解 答 】 
修改 后 的 代码 如 下 : 


addi $v0, S$zero, 0 
loop: lw S$vl, 0($a0) 

sw S$vl, 0($al) 

beq $vl, S$zero, exit 

addi $a0, S$a0, 4 

addi $al, S$al, 4 

addi $v0, S$v0O, 1 

Bl loop 


Gxits 
19. 考虑 下 面 的 C 语 言 程序 段 : 


for (i=0; i<=100; i=i+1;) 


a[i]=b[il+c; 


假定 数组 a 和 的 每 个 元 素 是 int 型 变量 , 首 地 址 分 别 存放 在 寄存 器 $a0 和 $al 中 。 
寄存 器 $t0 和 $s0 分 别 对 应 变量 i 和 c。 要 求 写 出 与 之 对 应 的 MIPS 指令 代码 ,并 计算 这 
段 代码 运行 过 程 中 所 执行 的 指令 条 数 和 数据 的 访 存 次 数 。 


【分 析 解 答 】 


每 个 数组 元 素 占 4 个 字 节 ,所 以 循环 体内 每 一 步 地 址 增 量 是 4。 上 述 程序 段 对 应 的 


MIPS 汇编 形式 的 指令 代码 序列 如 下 。 


add $t0, S$zero, S$zero 
loop: add $t4, $al, $t0 

lw S$t5, 0($t4) 

add S$t6, S$t5, $s0 

add S$t7, S$a0, $t0 

sw S$t6, 0(St7) 

addi $t0, S$t0, 4 

slti $t8, S$t0, 401 

bne S$t8, S$zero, loop 


#i=0 

#$t4=address of b[i] 

#$t5=b[i] 

#$t6=b[i]+c 

#$t7=address of a[i] 
#a[i]=b[i]+c 

扩 =i+ 4 

#if (i<401)then $t8=1 else $t8=0 
#if ($t8=1)go to loop 


该 段 代码 运行 过 程 中 共 执 行 了 1 十 101X8=809 条 指令 。 其 中 , 访 存 指令 条 数 ( 数 据 的 


访问 次 数 ) 为 202 条 。 


20. 某 高 级 语言 源 程序 中 的 一 个 while 语句 为 “while(save[i] 二 = 二 k)i 十 二 1;”, 若 对 其 
编译 时 ,编译 器 将 i 和 分 别 分 配 在 寄存 器 $s3 和 $s5 中 ,数组 save 的 基 址 存放 在 $s6 中 ， 


则 生成 的 MIPS 汇编 代码 段 如 下 。 


loop: sll S$tl, $s3, 2 
add S$tl, $tl, $s6 


lw $t0, 0($t1) 
bne $t0, $s5, exit 
addi $s3, $s3, 1 

| loop 


exit: 


#R[$t1]<R[$s3]<<2, 即 RISt1]=iX4 
#R[$t1]<R[I$t1]+R[$s6] ,Bh RIS$t1]= 
Address of savel[il] 
#R[$t0]<M[R[$t1]+0], 即 RI[$t0]=save[i] 
#if R[S$t0] 天 R[$s5] then goto exit 
#R[$s3]<R[$s3]+1, 即 i=i+1 

#goto loop 


假设 从 loop 处 开始 的 指令 存放 在 内 存 80000 处 , 则 上 述 循环 对 应 的 MIPS 机 器 码 如 


图 4.4 所 示 。 


根据 上 述 叙 述 ,回答 下 列 问题 ,要 求 说 明理 由 或 给 出 计算 过 程 。 
(1) MIPS 的 编 址 单位 是 多 少 ? 数组 save 每 个 元 素 占 几 个 字 节 ? 
(2) 为 什么 指令 “sll $tl，$s3，2? 能 实现 4Xi 的 功能 ? 

(3) 该 循环 指令 序列 中 哪些 是 R- 型 指令 ? 哪些 是 工 型 指令 ? 


(4) $t0 和 $s6 的 编号 各 为 多 少 ? 
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6 位 5 位 5 位 5 位 5 位 6 位 
80000| 0 0 9 | 9， | 2 0 
80004| 0 9 2 | 9， | 。% 32 
80008 | 35 9 8 | 0 
8002| 5 a | 2 
80016| 8 19 2 | 1 
80020 2 20000 











80024 
4.4 题 20 中 程序 的 机 器 级 代码 


(5) 指令 “j loop” 的 操作 码 是 什么 (用 二 进位 表示 )? 

(6) 标号 exit 的 值 是 多 少 ? 如 何 根据 指令 计算 得 到 ? 

(7) 标号 loop 的 值 是 多 少 ? 如 何 根据 指令 计算 得 到 ? MIPS 中 跳 转 指令 的 跳 转 范围 是 
多 少 ? 

【分 析 解 答 】 

(1) MIPS 的 编 址 单位 是 字 节 。 从 图 4. 4 中 可 看 出 ,每 条 指令 32 位 , 占 4 个 地 址 ,所 以 
一 个 地 址 中 有 8 位 ,因此 ,MIPS 的 编 址 单位 是 字 节 。 因 为 每 次 循环 取 数 组 元 素 时 ,其 下 标 
地 址 都 要 乘 以 4, 所 以 save 数组 的 每 个 元 素 占 4 个 字 节 。 

(2) 因为 这 是 左 移 指 令 , 左 移 2 位 ,相当 于 乘 以 2 一 4。 

(3) 从 图 4.4 可 看 出 ,第 1 和 第 2 条 为 R- 型 指令 ,第 3.4.5 条 为 工 型 指令 。 

(4) 从 图 4.4 中 第 3 和 第 4 条 指令 可 看 出 , $t0 的 编号 为 8, 从 第 2 条 指令 可 看 出 $s6 
的 编号 为 22 。 

(5) 指令 和 j loop” 的 操作 码 为 000010B。 

(6) 标号 exit 的 值 是 80024, 其 含义 是 循环 结束 时 跳出 循环 后 执行 的 首 条 指令 的 地 址 。 
它 由 当前 分 支 指令 (条 件 转移 指令 ) 的 地 址 80012 加 上 4 得 到 下 条 指令 的 地 址 ,然后 再 加 上 
相对 位 移 量 2X4 得 到 , 即 80012 十 4 十 2X4 王 80024。 

(7) 标号 loop 的 值 为 80000 ,是 循环 入 口 处 首 条 指令 的 地 址 ,由 跳 转 指令 j 的 32 位 地 址 
80020 的 高 4 位 (0000B) 与 指令 中 给 出 的 低 26 位 (20000) 拼 接 成 30 位 地 址 ,然后 再 在 低位 
添 两 个 0( 相 当 于 X4) 得 到 , 即 20000X4=80000。 因 为 跳 转 指令 的 地 址 与 其 跳 转 到 的 目标 
指令 地 址 的 高 4 位 一 样 ,所 以 ,如 果 将 4GB 的 主 存 空间 分 割 成 16 个 4GB/16 二 256MB 的 子 
空间 ,那么 跳 转 到 的 目标 指令 总 是 和 跳 转 指令 在 同一 个 子 空间 ,不 可 能 跳出 它 本 身 所 在 的 
256MB 的 子 空间 ,所 以 跳 转 目标 地 址 范围 的 大 小 是 256M, 也 即 ,假定 跳 转 指令 地 址 的 高 
4 位 为 X, 则 跳 转 目 标 地 址 范围 是 X000 0000H~XFFF FFFCH。 

21. 以 下 C 语 言 程 序 段 中 有 两 个 过 程 sum_array 和 compare, 假 定 sum_array 第 一 个 被 
调用 ,全 局 变量 sum 分 配 在 寄存 器 $s0 中 。 要 求 写 出 每 个 过 程 对 应 的 MIPS 汇编 表示 ,并 
说 明 每 个 过 程 对 应 的 栈 帧 中 需要 保存 的 信息 。 


1 int sum=0; 

和 int sum array (int array[]，int num) 
3 { 
4 


int i; 


5 for(i=0; i<num; i ++) 

6 if compare (num, i+1) sumt=array[i]; 

7 return sum; 

8 } 

9 int compare (int a, int b) 

10 { 

a if(a >b) 

12 return 1; 

13 else 

14 return 0; 

15 } 

【分 析 解 答 】 

程序 由 两 个 过 程 组 成 ,全 局 变量 sum 分 配 在 $s0, 在 过 程 调用 时 ,全 局 变量 无 须 人 栈 
保存 。 


为 了 尽量 减少 指令 条 数 ,并 减少 访 存 次 数 。 在 每 个 过 程 的 过 程 体 中 总 是 先 使 用 临时 寄 
存 器 $t0 一 $t9 ,临时 寄存 器 不 够 或 者 某 个 值 在 调用 过 程 返回 后 还 需要 用 ,就 使 用 保存 寄存 
器 $s0 一 $s7。 

MIPS 指令 系统 中 没有 寄存 器 传送 指令 ,为 了 提高 汇编 表示 的 可 读 性 ,引入 一 条 伪 指 令 
move 来 表示 寄存 器 传送 ,汇编 器 将 其 转换 为 具有 相同 功能 的 机 器 指令 。 伪 指令 “move 
$t0，$s0" 对 应 的 机 器 指令 为 “add $t0,$zero,$s0”。 

(1) 过 程 sum_array: 过 程 中 使 用 的 array 数组 是 入口 参数 ,而 不 是 局 部 变量 ,无须 在 该 
过 程 的 栈 帧 中 给 它 分 配 空间 ,array 数组 的 首 地 址 作为 人 口 参数 被 传递 给 过 程 sum_array 
(假定 在 $a0 中 )。 此 外 ,还 有 另 一 个 人 口 参数 为 num( 假 定 在 $al 中 ), 最 后 有 一 个 返回 参 
数 sum。 因 为 该 过 程 中 又 调用 了 compare 过 程 , 因 此 它 不 是 叶子 过 程 。 所 以 ,其 栈 帧 中 除了 
保留 所 用 的 保存 寄存 器 外 ,还 必须 保留 返回 地 址 $ra, 以 免 在 调用 过 程 compare 时 被 覆盖 。 
是 否 保存 $ fp 要 看 具体 情况 ,如 果 确 保 后 面 一 直 都 用 不 到 $ fp, 则 可 以 不 保存 它 , 但 编译 器 
往往 无 法 预测 这 种 情况 ,所 以 通常 采用 统一 的 做 法 , 即 总 是 保存 $fp 的 值 。 因 而 ,该 过 程 的 
栈 帧 中 要 保存 的 信息 有 返回 地 址 $ ra 和 帧 指针 $fp, 其 栈 帧 空间 大 小 至 少 为 4X2=8B。 

汇编 表示 如 下 : 


move $s0, $zero #sum=0 
sum array: addi $sp, $sp, -8 #generate stack frame 
Sw $ra, 4($sp) #save $ ra on stack 
Sw $fp, 0($sp) #save $fp on stack 
addi $fp, $sp, 4 #set $fp 
move $t2, $a0 #base address of array 
move S$t0, S$al #$t0=num 
move $t3, $zero =0 
loop: slt $tl, S$t3, S$t0 #if (i<num) $t1l=1lelse $t1=0 


beq $tl, S$zero, exitl #if(S$tl=0) jump to exitl 
move $a0, $t0 #$a0=num 
move S$al, $t3 #$al=i 
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addi $al, $al, 1 #$al=i+1 
jal compare #call compare 
beq $v0, S$zero, else #if ($v0=0)jump to else 
sll $tl, S$t3, 2 #i=iX4 
add $tl, S$t2, $tl1 #$tl=array[i] 
1w $t4, 0O($t1) #1oad array[il] 
add $s0, $s0, S$t4 #sum+=array [i] 
else: addi $t3, $t3, 1 大 =i+1 
| loop 
exitl: 1w $ra, 4($sp) #restore $ra 
1w $fp, 0($sp) #restore $fp 
addi $sp, $sp, 8 #free stack frame 
jr $ra #return to caller 


(2) 过 程 compare: 人 口 参数 为 a 和 b, 分 别 在 $a0 和 $al 中 ,有 一 个 返回 参数 ,没有 局 
部 变量 ,是 叶子 过 程 , 且 过 程 体 中 没有 用 到 任何 保存 寄存 器 ,所 以 栈 帧 中 不 需要 保留 任何 
信息 。 


compare: move $v0, $zero # 起 初 返回 值 设 定 为 0 
beq $a0, S$al, exit2 #if($a0=$al)jump to exit2 
slt $tl, S$a0, S$al #if ($a0<$al)$ tl=lelse $tl=0 
bne $tl, S$zero, exit2 #if ($a0<$al)jump to exit2 
ori $v0， $zero 1 # 返 回 值 设 定 为 1 

exit2: 4 $ra 


22. 以 下 是 一 个 计算 阶乘 的 C 语言 递归 过 程 , 请 按照 MIPS 过 程 调用 协议 写 出 该 递归 
过 程 对 应 的 MIPS 汇编 语言 程序 ,要 求 目标 代码 尽量 短 ( 提 示 : 乘法 运算 可 用 乘法 指令 “mul 
rd, rsy rt" 来 实现 ) 。 


int fact(int n) 
{ 
if (n<1) 
return (1); 
else 
IFeturn (nx fact (n-1)); 


} 


【分 析 解 答 】 

过 程 fact 有 一 个 输入 参数 n, 按 MIPS 过 程 调用 协议 ,n 应 在 $a0 中 ,返回 参数 应 存放 
在 $v0 中。 过 程 内 没有 局 部 变量 , 故 无 须 在 其 栈 帧 中 保留 局 部 变量 所 用 空间 ; 需 递 归 调 用 
fact 过 程 , 所 以 必须 在 其 栈 帧 中 保留 返回 地 址 $ra。 过 程 体内 全 部 使 用 临时 寄存 器 $t0 一 
$t9 ,因而 无 须 在 其 栈 帧 中 保存 通用 寄存 器 。 因 为 是 递归 调用 ,所 以 需 在 栈 帧 中 保留 输入 参 
数 。 因 而 ,该 过 程 的 栈 帧 中 要 保存 的 信息 有 返回 地 址 $ ra、 帧 指针 $fp 和 输入 参数 $a0, 其 
栈 帧 空间 大 小 至 少 为 4X3 王 12B。 


fact: addi $sp, $sp, -12 #generate stack frame 


exitl: 


exit: 


$ra, 
$fp, 
$fp, 
$a0, 
St0v 
St0v 
$a0, 
fact 
Stl， 
$vo, 
exit 
$vO, 
$ra, 
$fp, 
$sp, 


$ra 


8 ($sp) 
4($sp) 
$sp, 0 
0($fp) 
$a0, 1 
$zero, exitl 
$a0, -1 
0($fp) 
$tl, $vO 
$zero, 1 
8 ($sp) 
4($sp) 
$sp, 12 


#save $ ra on stack 

#save $fp on stack 

#set $fp 

#save $a0 (n) on stack 

#if (n<1)$t0=lelse $t0=0 
#if (n<1)goto exitl 
#n=n-1 

#call fact 

# Testore n 


#$vO=n* fact (n-1) 


#$vO=1 

#restore $ra 
#restore $fp 
#free stack frame 


#return to caller 


| 
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5.1 教学 目标 和 内 容 安排 


主要 教学 目标 ; 使 学 生 了 解 CPU 的 主要 功能 .CPU 的 内 部 结构 、 指 令 的 执行 过 程 、 数 
据 通路 的 基本 组 成 ,数据 通路 的 定时 、 数 据 通路 中 信息 的 流动 过 程 ,控制 器 的 实现 方式 、 硬 连 
线路 控制 器 的 设计 、 微 程序 控制 器 的 设计 、 异 常 和 中 断 的 概念 等 ,为 进一步 深入 理解 流水 线 
CPU 的 设计 原理 和 高 级 流水 线 技术 打下 基础 。 

基本 学 习 要 求 ， 

(1) 理解 CPU 的 功能 。 

(2) 了 解 CPU 的 基本 结构 。 

(3) 理解 CPU 中 通用 寄存 器 和 专用 寄存 器 的 作用 。 

(4) 理解 一 条 指令 的 基本 执行 过 程 。 

(5) 理解 指令 周期 .机 器 周期 \ 时 钟 周期 的 概念 。 

(6) 了 解数 据 通路 的 基本 组 成 。 

(7) 了 解数 据 通 路 中 哪些 是 组 合 逻 辑 部 件 , 哪 些 是 时 序 逻 辑 部 件 。 

(8) 了 解数 据 通 路 中 的 组 合 逻 辑 部 件 和 时 序 远 辑 部 件 的 差别 。 

(9) 了 解 寄存 器 堆 ( 通 用 寄存 器 组 ) 的 作用 与 工作 原理 。 

(10) 了 解 多 路 选择 器 的 作用 与 工作 原理 。 

(11) 了 解 ALU 在 数据 通路 中 的 功能 。 

(12) 了 解 加 法 器 和 ALU 的 差别 。 

(13) 了 解 指令 存储 器 和 数据 存储 器 之 间 的 差别 。 

(14) 了 解 取 指 阶段 的 数据 流动 过 程 。 

(15) 了 解 从 通用 寄存 器 中 取 数 的 过 程 。 

(16) 了 解数 据 运 算 过 程 。 

(17) 了 解 存储 器 取 数 时 的 数据 流动 过 程 。 

(18) 了 解 向 通用 寄存 器 中 存 数 时 的 数据 流动 过 程 。 

(19) 了 解 如 何 实现 条 件 转移 的 数据 通路 。 

(20) 了 解 如 何 实 现 无 条 件 转移 的 数据 通路 。 

(21) 了 解 “0” 扩 展 和 “符号 ”扩展 的 含义 和 实现 方式 。 


史 天 处 理 器 


(22) 理解 如 何 确 定单 周期 数据 通路 的 时 钟 周期 。 

(23) 理解 如 何 确定 多 周期 数据 通路 的 时 钟 周期 。 

(24) 理解 单 周期 数据 通路 和 多 周期 数据 通路 的 差别 。 

(25) 理解 为 什么 很 少 有 机 器 采用 单 周期 数据 通路 。 

(26) 理解 数据 通路 的 设计 和 CPI 之 间 的 关系 。 

(27) 理解 指令 格式 的 规整 性 对 数据 通路 设计 的 影响 。 

(28) 理解 各 个 控制 信号 的 含义 、 控 制 点 以 及 在 各 指令 中 的 取 值 。 
(29) 了 解 控制 器 的 设计 步骤 和 实现 方式 。 

(30) 掌握 如 何 用 组 合 逻 辑 设计 方式 实现 硬 布 线 控制 器 。 

(31) 了 解 利用 微 程序 设计 方式 实现 微 程 序 控制 器 的 基本 原理 。 
(32) 理解 内 部 异常 和 外 部 中 断 的 概念 。 

(33) 理解 为 什么 在 设计 处 理 器 时 必须 考虑 异常 和 中 断 的 处 理 。 
(34) 了 解 如 何在 数据 通路 设计 中 考虑 异常 和 中 断 的 处 理 。 
(35) 理解 内 部 异常 和 外 部 中 断 的 区 别 。 

(36) 理解 常见 异常 事件 的 含义 和 处 理 方式 。 

(37) 理解 带 中 断 的 指令 执行 过 程 。 


本 章 是 本 课程 的 核心 内 容 ,主要 介绍 CPU 中 执行 指令 的 数据 通路 及 其 控制 逻辑 电路 
的 设计 。 其 重点 内 容 包 括 数据 通路 的 定时 、 单 周期 数据 通路 、 单 周期 控制 器、 微 程序 概念 和 
带 异 常 和 中 断 处 理 的 处 理 器 实现 。 

主教 材 分 CPU 概述 , 单 周期 处 理 器 设计 多 周期 处 理 器 设计 、 微 程序 控制 器 设计 、 异 党 
和 中 断 处 理 这 5 个 部 分 进行 了 介绍 。 

在 CPU 概述 中 ,给 出 了 CPU 设计 涉及 的 基本 问题 ,基本 概念 和 CPU 设计 的 基本 思 
路 。 这 部 分 内 容 是 最 基础 的 部 分 ,需要 让 学 生 很 好 地 掌握 。 不 过 ,对 其 中 一 些 概念 和 知识 的 
理解 ,还 需要 在 后 面具 体 的 数据 通路 设计 和 控制 器 设计 的 学 习 过 程 中 得 到 深化 。 因 此 ,在 后 
面 单 周期 处 理 器 设计 和 多 周期 处 理 器 设计 的 内 容 介绍 过 程 中 ,可 以 通过 对 具体 情况 的 分 析 ， 
强化 在 CPU 概述 中 介绍 的 内 容 。 

为 了 全 面 清楚 地 说 明 CPU 数据 通路 结构 的 发 展 过 程 ,主教 材 在 CPU 概述 中 简单 介绍 
了 早期 单 总 线 数据 通路 和 三 总 线 数据 通路 ,与 后 面 介 绍 的 单 周期 数据 通路 、 多 周期 数据 通路 
以 及 第 7 章 介绍 的 流水 线 数据 通路 和 高 级 流水 线 数据 通路 串 接 起 来 ,就 形成 了 数据 通路 结 
构 发 展演 变 的 技术 路 线 图 ,建议 教学 过 程 中 要 有 意识 地 帮助 学 生理 解 这 个 技术 演变 过 程 ,并 
分 析 这 种 演变 过 程 的 原因 所 在 。 在 这 部 分 内 容 中 ,可 对 有 关 单 总 线 数据 通路 的 内 容 进 行 较 
为 详细 的 介绍 。 

在 介绍 单 周期 处 理 器 和 多 周期 处 理 器 设计 内 容 时 ,主要 以 MIPS 指令 系统 中 有 代表 性 
的 几 条 指令 作为 实现 目标 。 其 中 ,对 单 周 期 处 理 器 设计 内 容 介绍 较为 详细 ,这 样 做 的 原因 有 
两 个 ,第 一 ,因为 单 周期 处 理 器 的 结构 与 流水 线 处 理 器 的 结构 比较 类 似 , 掌 握 单 周期 数据 通 
路 及 其 控制 好 辑 电 路 的 设计 方法 ,能 更 好 地 理解 流水 线 处 理 器 的 设计 方法 。 第 二 ,因为 单 周 
期 处 理 器 设计 过 程 比较 简单 ,便于 学 生理 解 CPU 设计 的 原理 性 内 容 。 因 此 ,建议 在 课堂 教 
学 中 对 单 周期 处 理 器 的 设计 内 容 进 行 较为 详细 的 介绍 。 在 课时 有 限 的 情况 下 ,对 于 多 周期 
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即 可 。 

对 于 微 程序 控制 器 设计 ,着 重 讲 清楚 微 程序 控制 器 的 基本 设计 思想 和 基本 结构 . 微 指 令 
格式 和 微 命令 编码 方式 ,以 及 微 程序 执行 顺序 的 控制 方式 。 主 教材 中 例 5. 2、 例 5. 3 和 
例 5. 4 都 是 为 了 便于 理解 基本 原理 而 给 出 的 ,只 是 为 了 给 学 生 提供 具体 示例 ,以 达到 通过 对 
概念 的 具体 运用 来 更 好 地 理解 概念 的 目的 ,对 于 这 些 例子 ,如 果 课 时 有 限 , 课 堂上 只 要 大 致 
讲 一 下 字段 如 何 划分 ,然后 对 其 中 的 一 个 字段 简单 说 明 一 下 如 何 编码 ,不 需要 在 课堂 上 详细 
展开 讲解 ,细节 问题 可 留 给 学 生 自学 ,如 果 学 生 自 学 时 不 能 明白 一 些 具体 的 细节 问题 ,也 没 
有 关系 ,只 要 学 生 通过 例子 能 够 掌握 基本 原理 就 行 了 。 

本 章 最 后 一 个 内 容 是 异常 和 中 断 处 理 , 是 本 课程 和 操作 系统 课程 中 最 重要 的 概念 之 一 ， 
对 学 生 将 来 从 事 处 理 器 设计 .操作 系统 开发 和 设计 、 嵌 入 式 软 硬 件 设计 等 都 非常 有 用 。 对 了 
这 部 分 内 容 ,学 生 普遍 存在 的 一 些 问题 是 : 分 不 清 异 常 和 中 断 在 检测 ,响应 和 处 理 过 程 中 的 
不 同 ;分 不 清 CPU 和 1/O 接口 中 各 自 需要 对 异常 和 中 断 承担 哪些 职责 ;分 不 清 哪些 由 硬件 
完成 ,哪些 由 软件 完成 ,等 等 。 因 为 CPU 设计 涉及 异常 和 中 断 ,所 以 ,在 本 章 中 应 该 把 
CPU ,内 部 异常 ,外 部 中 断 和 输入 输出 这 4 者 的 关系 交代 清楚 。 主 教材 对 内 部 异常 和 外 部 
中 断 的 基本 概念 以 及 异常 处 理 过 程 进行 了 较为 详细 的 说 明 , 并 结合 多 周期 数据 通路 以 及 反 
映 指令 执行 过 程 的 有 限 状 态 机 ,对 CPU 中 涉及 异常 和 中 断 处 理 的 功能 和 部 件 进行 了 说 明 。 
因为 是 结合 具体 的 数据 通路 进行 说 明 ,学 生 阅 读 起 来 应 该 比较 容易 明白 。 


5.2 主要 内 容 提 要 
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1. CPU 的 基本 功能 

CPU 总 是 周而复始 地 执行 指令 ,并 在 执行 指令 过 程 中 检测 和 处 理 内 部 异常 事件 和 外 部 
中 断 请 求 。 在 此 过 程 中 ,要 求 CPU 具有 以 下 各 种 功能 。 

(1) 取 指令 并 译 码 : 从 存储 器 取出 指令 ,并 对 指令 操作 码 译 码 ,以 控制 CPU 进行 相应 
的 操作 。 

(2) 计算 PC 的 值 ; 通过 自动 计算 PC 的 值 来 确定 下 一 条 指令 地 址 ,以 正确 控制 执行 
顺序 。 

(3) 算术 逻辑 运算 : 计算 操作 数 地 址 ,或 对 操作 数 进行 算术 或 逻辑 运算 。 

(4) 取 操作 数 或 写 结果 : 通过 控制 对 存储 器 或 I/O 接口 的 访问 来 读 取 操 作 数 或 写 
结果 。 
(5) 异常 或 中 断 处 理 : 检测 有 无 异常 事件 或 中 断 请 求 , 必 要 时 响应 并 调 出 相应 处 理 程 
序 执行 。 

(6) 时 序 控制 : 通过 生成 时 钟 信号 来 控制 上 述 每 个 操作 的 先后 顺序 和 操作 时 间 。 

2. CPU 的 基本 结构 

CPU 主要 由 数据 通路 (datapath) 和 控制 单元 (control unit) 组 成 。 

数据 通路 中 包含 组 合 逻辑 单元 和 存储 信息 的 状态 单元 。 组 合 逻 辑 单元 用 于 对 数据 进行 
处 理 , 如 加 法 器 .ALU 扩展 器 (0 扩展 或 符号 扩展 )、 多 路 选择 器 以 及 总 线 接口 逻辑 等 ;状态 
单元 包括 触发 器 ,寄存 器 等 ,用 于 对 指令 执行 的 中 间 状 态 或 最 终结 果 进 行 保存 。 

控制 单元 也 称 为 控制 器 ,主要 功能 是 对 取出 的 指令 进行 译 码 ,并 与 指令 执行 得 到 的 条 件 
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码 或 当前 机 器 的 状态 .时 序 信号 等 组 合 , 生 成 对 数据 通路 进行 控制 的 控制 信号 。 

3. CPU 中 的 寄存 器 

CPU 中 存在 大 量 寄存 器 ,根据 对 用 户 程序 的 透明 程度 可 以 分 成 以 下 三 类 。 

(1) 用 户 可 见 寄存 器 。 

指 用 户 程序 中 的 指令 可 直接 访问 或 间接 修改 其 值 的 寄存 器 。 包 括 通用 寄存 器 、 地 址 寄 
存 器 和 程序 计数 器 PC。 通 用 寄存 器 可 用 来 存放 地 址 或 数据 ;地 址 寄存 器 专门 用 来 存放 首 地 
址 或 指针 信息 ,如 段 寄 存 器 、 变 址 寄存 器 、 基 址 寄存 器 ,堆栈 指针 、 帧 指针 等 ;程序 计数 器 PC 
存放 当前 或 下 条 指令 的 地 址 。 

(2) 用 户 部 分 可 见 寄存 器 。 

指 用 户 程序 中 的 指令 只 能 读 取 部 分 信息 的 寄存 器 ,如 程序 状态 字 寄 存 器 PSWR 或 标志 
(条 件 码 ) 寄 存 器 FLAG, 其 内 容 由 CPU 根据 指令 执行 结果 自动 设 定 , 用 户 程序 执行 过 程 中 
可 能 会 隐 含 读 出 其 部 分 内 容 , 以 确定 程序 的 执行 顺序 ,但 不 能 修改 这 些 寄存 器 的 内 容 。 

(3) 用 户 不 可 见 寄存 器 。 

指 用 户 程序 不 能 进行 任何 访问 操作 的 寄存 器 ,这 些 寄存 器 大 多 用 于 记录 控制 信息 和 状 
态 信息 ,只 能 由 CPU 硬件 或 操作 系统 内 核 程序 访问 。 例 如 ,指令 寄存 器 IR 用 来 存放 正在 
执行 的 指令 ,只 能 被 硬件 访问 ;存储 器 地 址 寄存 器 (MAR) 和 存储 器 数据 寄存 器 (MDR 分别 
用 来 存放 将 要 访问 的 存储 单元 的 地 址 和 数据 ,也 由 硬件 直接 访问 ;中 断 请 求 寄存 器 .进程 控 
制 块 指针 、 系 统 堆栈 指针 、 页 表 基 址 寄存 器 等 寄存 器 只 能 由 内 核 程序 访问 ,因此 也 都 是 用 户 
不 可 见 寄存 器 。 

4. 指令 执行 过 程 

指令 的 执行 过 程 大 致 分 为 取 指 、 译 码 、 取 数 、 运 算 、 存 结果 、 查 中 断 等 几 个 步骤 。 指 令 周 
期 是 指 取出 并 执行 一 条 指令 的 时 间 , 它 由 若干 个 机 器 周期 或 直接 由 若干 个 时 钟 周期 组 成 。 

早期 的 机 器 因为 没有 引入 cache, 所 以 每 个 指令 周期 都 要 执行 一 次 或 多 次 总 线 操作 ,以 
访问 主 存 读 取 指 令 或 进行 数据 的 读 写 ,因而 ,将 指令 周期 分 成 若干 机 器 周期 ,每 个 机 器 周期 
对 应 CPU 内 部 操作 或 某 种 总 线 事务 类 型 ,一 个 总 线 事务 访问 一 次 主 存 或 1/O 接口 。 因 为 
一 个 总 线 事务 中 需要 送 地 址 和 读 写 命令 ,等待 主 存 进行 读 写 操作 等 ,需要 多 个 时 钟 周期 才能 
完成 ,所 以 一 个 机 器 周期 又 由 多 个 时 钟 周期 组 成 。 

现代 计算 机 引入 cache 后 ,大 多 数 情况 下 都 不 需要 访问 主 存 , 而 可 以 直接 在 CPU 内 的 
cache 中 读 取 指令 或 访问 数据 ,因此 ,每 个 指令 周期 直接 由 若干 个 时 钟 周期 组 成 。 时 钟 是 
CPU 中 用 于 控制 同步 的 信号 ,时 钟 周期 是 CPU 中 最 小 的 时 间 单 位 。 

5. 数据 通路 的 实现 

现代 计算 机 都 采用 时 钟 信号 进行 定时 ,一 旦 时 钟 边沿 信号 到 来 ,数据 通路 中 的 状态 单元 
开始 写 和 信息。 不 同 指令 其 功能 不 同 ,所 以 ,每 条 指令 执行 时 数据 在 数据 通路 中 所 经 过 的 路 
径 及 其 路 径 上 的 部 件 都 可 能 不 同 。 不 过 ,每 条 指令 在 取 指令 阶段 都 一 样 。 

根据 是 否 将 所 有 部 件 通过 总 线 相连 ,可 将 数据 通路 分 成 总 线 式 数据 通路 和 非 总 线 式 数 
据 通路 ;根据 指令 执行 过 程 是 否 按 流水 线 方式 进行 ,可 将 数据 通路 分 成 非 流 水 线 数据 通路 和 
流水 线 数据 通路 。 总 线 式 数据 通路 无 法 实现 指令 流水 线 , 所 以 ,一 定 是 非 流 水 线 数据 通路 。 
现代 计算 机 都 采用 流水 线 数据 通路 。 

总 线 式 数据 通路 中 ,各 个 通用 寄存 器 和 ALU 的 输入 、 输 出 端 之 间 都 通过 CPU 内 部 总 


击溃 


计算 机 组 成 与 系统 结 攀 习题 解答 和 教学 指 早 (第 2 版) 





线 交换 数据 ,因为 总 线 上 某 一 时 刻 只 能 传送 一 个 部 件 送出 的 信息 ,所 以 ,总 线 式 CPU 中 执行 指 
令 时 ,每 一 步 都 只 能 串 行进 行 ,速度 很 慢 。 若 所 有 部 件 连接 到 一 个 总 线 上 , 则 是 单 总 线 数据 通 
路 ;也 可 以 将 ALU 的 输入 和 输出 端 分 别 连 到 不 同 的 两 个 总 线 上 ,构成 双 总 线 数据 通路 ;还 可 以 


将 ALU 的 两 个 输入 端 和 一 个 输出 端 分 别 连接 到 三 个 总 线 上 ,构成 三 总 线 数据 通路 。 
非 总 线 式 数据 通路 可 以 设计 成 单 周 期 数据 通路 ,多 周期 数据 通路 和 流水 线 数据 通路 。 
以 下 用 例子 来 说 明 单 周期 数据 通路 ,多 周期 数据 通路 的 实现 。 流 水 线 数据 通路 的 实现 在 下 


一 章 介绍 。 


6. 数据 通路 设计 举例 
以 MIPS 指令 系统 为 例 ,以 下 概要 介绍 单 周期 数据 通路 和 多 周期 数据 通路 的 设计 原理 





和 设计 步骤 。 

(1) 确定 实现 目标 。 为 方便 起 见 , 假 定数 据 通路 实现 的 目标 是 表 5. 1 所 示 的 11 条 
MIPS 指令 。 

表 5.1 11 条 目标 指令 及 其 功能 描述 
指 令 功 能 说 明 
从 PC 所 指 的 内 存单 元 中 取 指令 ,并 PC 加 4 

add rd,rs,rt MLPC],PC<PC 十 4 
er R[rd]<R[rs] + RErt] 从 rssrt 中 取 数 后 相 加 减 , 若 溢出 则 异常 处 理 ,否则 结 


果 送 rd 





subu rd,rs,rt 


R[rd]j<—R[rs]—R[rt] 


从 rs.rt 中 取 数 后 相 减 ,结果 送 rd( 不 进行 洲 出 判 
断 ) 











J 从 ts.rt 中 取 数 后 按 带 符号 整数 来 判断 丙 数 大 小 
slt rd,rs,rt le 小 于 则 rd 中 置 1, 否 则 ,rd 中 清 零 
Rd] 0 (不 进行 溢出 判断 ) 
人 从 ts.rt 中 取 数 后 按 无 符号 数 来 判断 两 数 大 小 
sltu rd,rs,rt he 小 于 则 rd 中 置 1 ,否则 ,rd 中 清 零 
R[rd。 0 (不 进行 溢出 判断 ) 
ori rtyrsyimml6 | R[rt]<R[Lrs]|ZeroExt(imm16) 从 二 取 数 ,将 imm16 进行 零 扩展 ,然后 两 者 按 位 


或 ,结果 送 rt 





addiu rt,rsyimml6 


R[rt]<R[rs]+SignExt(imm16) 


从 rs 取 数 ,将 imm16 进行 符号 扩展 ,然后 两 者 相 
加 ,结果 送 rt( 不 进行 溢出 判断 ) 





lw rt'rsyimml6 


Addr<-R[rs]+SignExt(imml6) 
R[rt]<—M[Addr] 


从 rs 取 数 ,将 imml6 进行 符号 扩展 ,然后 两 者 相 
加 ,结果 作为 访 存 地 址 Addr, 从 Addr 中 取 数 并 送 rt 





sw rt,rs,imml6 


Addr<-R[rs]+ SignExt(imml6) 
M[Addr]<R[rt] 





从 rs 取 数 ,将 imm16 进行 符号 扩展 ,然后 两 者 相 
加 ,结果 作为 访 存 地 址 Addr, 将 rt 送 Addr 中 





beq rs,rt,imm16 


Cond<—R[rs]—R[rt] 

if (Cond eq 0) 
PC<PC+4+ (SignExt(imml6) 
X4) 


做 减法 以 比较 rs 和 rt 中 内 容 的 大 小 ,并 计算 下 一 
条 指令 地 址 ,然后 根据 比较 结果 修改 PC。 转 移 目 
标 地 址 采用 相对 寻 址 ,基准 地 址 为 下 一 条 指令 地 
址 ( 即 PC 十 4) ,位 移 量 为 立即 数 imml6 经 符号 扩 
展 后 的 值 的 4 倍 。 因 此 ,转移 目标 指令 的 范围 为 
相对 于 当前 指令 的 前 32 767 到 后 32 768 条 指令 





j target 





PC<31:2><PC<31:28> | 
target<25:0> 





第 一 步 无 须 进行 PC 十 4 而 直接 计算 目标 地 址 , 符 
号 | 表示 “拼接 ” 


史 天 处 理 器 


表 5. 1 给 出 了 每 条 指令 的 RTL 描述。 每 条 指令 的 取 指 阶段 功能 都 一 样 , 都 需要 从 PC 


所 指 的 内 存单 元 中 取 指 令 , 并 PC 加 4。 为 了 避免 重复 说 明 , 表 中 省 略 了 对 取 指 阶段 功能 的 
描述 。 


第 
5 
章 


图 5. 1 给 出 了 三 种 MIPS 指令 格式 , 表 5. 1 中 前 5 条 是 R- 型 指令 ,随后 5 条 是 工 型 指 
令 , 最 后 一 条 跳 转 指令 j target 是 二 型 指令 。 
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5.1 MIPS 指令 格式 


(2) 设计 ALU 电路 。 对 目标 指令 中 涉及 的 所 有 运算 进行 分 析 , 确 定 用 于 这 些 运算 的 
ALU 及 其 控制 电路 如 何 设计 。 从 表 5. 1 可 以 看 出 ,这 11 条 指令 涉及 的 运算 包括 带 溢出 检 


测 的 加 法 和 减法 、. 带 符号 整数 大 小 判断 ,无 符号 数 大 小 判断 ,相等 判断 以 及 各 种 多 辑 运算 等 
图 5. 2 给 出 了 实现 这 些 运算 的 ALU 电路 。 
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上 述 ALU 中 的 核心 部 件 是 加 法 器 ,减法 运算 也 在 该 加 法 器 中 实现 ,加 法 器 有 进位 标志 
Add-carry, 零 标志 Zero、 溢 出 标志 Add-Overflow 和 符号 标志 Add-Sign。 该 ALU 的 输入 为 
两 个 32 位 操作 数 A 和 B, Result 作为 ALU 运算 的 结果 被 输出 ,同时 , 零 标志 Zero 和 溢出 
标志 Overflow 也 被 作为 ALU 的 结果 标志 信息 输出 。 

为 了 实现 对 ALU 操作 的 控制 ,需要 有 相应 的 操作 控制 信号 。 在 操作 控制 端 ALUctr 
的 控制 下 ,图 5. 2 中 的 “ALU 操作 控制 信号 生成 部 件 ” 用 来 生成 各 种 操作 控制 信号 ,以 控制 
在 ALU 中 执行 “加 法 ”“ 减 法“ 按 位 或 “ 带 符号 整数 比较 小 于 置 1" 和 * 无 符号 数 比较 小 于 置 
1” 等 运算 。 

(3) 设计 取 指 令 部 件 。 取 指令 操作 是 每 条 指令 的 公共 操作 ,其 功能 是 取 指 令 并 计算 下 
条 指令 地 址 。 若 是 顺序 执行 , 则 下 条 执行 指令 地 址 为 PC 十 4; 若 是 转移 执行 , 则 要 根据 当前 
指令 是 分 支 指令 还 是 跳 转 指令 分 别 计算 转移 目标 地 址 。 因 为 指令 长 度 为 32 位 , 主 存 按 字 节 
编 址 ,所 以 指令 地 址 总 是 4 的 倍数 , 即 最 后 两 位 总 是 00, 因 此 ,PC 中 只 需 存 放 前 30 位 地 址 
PC<31:2>> ,在 取 指令 时 ,指令 地 址 =PC<31:2 之 ||*00”。 下 条 指令 地 址 的 计算 方法 如 下 。 

顺序 执行 指令 时 : PC<31:2>>< PC<31:2 之 十 1。 

Branch 指令 中 条 件 满足 转移 执行 时 ; PC<<31:2 之 二 PC<<31:2 之 十 1 十 SignExt 
[Imml16] 。 

Jump 指令 跳 转 执行 时 : PC<31:2 之 PC<31:28>>||target<25:0>。 

根据 上 述 指令 地 址 计算 方法 ,图 5. 3 给 出 了 完整 的 取 指令 部 件 。 
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-| Addr<1:0> 
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Zero 


图 5.3 完整 的 取 指令 部 件 


取 指 令 部 件 的 输出 是 指令 ,输入 有 三 个 : 标志 Zero 和 控制 信号 Branch Jump。 下 地 址 
逻辑 中 的 立即 数 imm16 和 目标 地 址 target<25:0 之 都 直接 来 自 取出 的 指令 。 分 支 指令 时 
Branch 二 1, Jump 王 0, 跳 转 指令 时 Branch 二 0, Jump 二 1, 其 他 指令 时 Branch 二 Jump 二 0。 

(4) 单 周 期 数据 通路 设计 。11 条 指令 中 ,lw 指令 最 复杂 ,执行 lw 指令 过 程 中 数据 所 经 
过 的 部 件 最 多 ,路 径 最 长 ,因此 ,以 它 为 基准 设计 单 周期 数据 通路 。 图 5. 4 给 出 了 能 够 执行 
11 条 目标 指令 的 完整 的 单 周 期 数据 通路 。 
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5.4 完整 的 单 周 期 数据 通路 


图 5.4 中 带 下 划 线 的 是 控制 信号 ,用 于 控制 数据 通路 的 执行 ,由 专门 的 控制 逻辑 单元 根 
据 对 当前 指令 的 译 码 结果 生成 控制 信号 。 


(5) 时 钟 周期 的 确定 。 


单 周期 处 理 器 每 条 指令 在 一 个 时 钟 周期 内 完成 ,所 以 CPI 为 1， 


时 钟 周期 通常 取 最 复杂 指令 所 用 的 指令 周期 。 在 给 出 的 11 条 指令 中 ,最 长 的 是 lw 指令 周 


期 。 图 5. 


5 给 出 


了 lw 指令 执行 定时 过 程 ,从 图 中 可 以 看 出 ,lw 指令 周期 所 包含 的 时 间 为 ， 


PC 锁 存 延迟 (Clk-to-Q) 十 取 指 令 时 间 十 寄存 器 取 数 时 间 十 ALU 延迟 十 存储 器 取 数 时 间 十 
寄存 器 建立 时 间 十 时 钟 扭 斜 。 
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图 5.5 lw 指令 执行 定时 
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单 周 期 处 理 器 时 钟 周期 远 远大 于 许多 指令 实际 所 需 执行 时 间 , 例 如 ,R- 型 指令 和 立即 
数 运算 指令 在 指令 执行 过 程 中 都 不 需要 读 内 存 ; sw 指令 不 需要 写 寄存 器 ;分 支 指令 不 需要 
访问 内 存 和 写 寄存 器 ; 跳 转 指令 不 需要 ALU 运算 和 内 存 ( 寄 存 器 ) 的 读 写 。 因 而 , 单 周期 处 
理 器 的 效率 低下 ,性 能 极 差 , 实 际 上 ,现在 很 少 用 单 周 期 方式 设计 CPU。 介 绍 单 周 期 数据 通 
路 ,只 是 为 了 帮助 理解 实际 的 多 周期 和 流水 线 两 种 方式 。 

(6) 多 周期 数据 通路 设计 。 多 周期 处 理 器 的 基本 思想 为 : 把 每 条 指令 的 执行 分 成 多 个 
大 致 相等 的 阶段 ,每 个 阶段 在 一 个 时 钟 周期 内 完成 ;各 阶段 内 最 多 完成 一 次 访 存 或 一 次 寄存 
器 读 / 写 或 一 次 ALU 操作 ;各 阶段 的 执行 结果 在 下 个 时 钟 到 来 时 保存 到 相应 存储 单元 或 稳 
定 地 保持 在 组 合 电路 中 ;时 钟 周期 的 宽度 以 最 复杂 阶段 所 花 时 间 为 准 ,通常 取 一 次 存储 器 读 
写 的 时 间 。 图 5.6 给 出 了 实现 11 条 目标 指令 的 多 周期 数据 通路 ,其 中 带 下 划 线 的 是 控制 
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图 5.6 带 控制 信号 的 多 周期 数据 通路 








(7) 分 析 每 条 指令 的 执行 过 程 ,得 到 指令 执行 状态 转换 图 。 对 于 取 指令 周期 (IFetch) 
和 取 数 / 译 码 周期 (RFetch/ID) ,每 条 指令 所 进行 的 操作 完全 一 样 。 除 了 取 指 令 和 译 码 / 取 
数 两 个 周期 外 ,在 11 条 目标 指令 中 ,R- 型 指令 还 需要 一 个 执行 周期 (RExec) 和 一 个 结束 回 
写 周 期 (RFinish); ori 指令 也 还 需要 一 个 执行 周期 (oriExec) 和 一 个 结束 回 写 周 期 
(oriFinish) ;分 支 指令 和 跳 转 指令 都 是 只 需要 一 个 周期 ,分 别 是 BrFinish 和 JumpFinish;lw 
和 sw 共用 一 个 主 存 地 址 计算 周期 (MemAdr) ,然后 根据 指令 是 lw 还 是 sw, 确 定 后 面 是 写 
主 存 周期 (swFinish) 还 是 取 数 周期 (MemFetch) 或 写 寄 存 器 周期 (lwFinish)。11 条 指令 在 
图 5. 6 所 示 的 多 周期 数据 通路 中 执行 时 的 状态 转换 过 程 如 图 5.7 所 示 。 
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5.7 指令 执行 状态 转换 图 


图 5.7 反映 了 指令 在 多 周期 数据 通路 中 执行 时 的 状态 转换 过 程 , 每 个 周期 对 应 一 个 状 
态 。 每 来 一 个 时 钟 ,进入 下 一 个 执行 状态 。 从 图 5. 7 可 看 出 ,R- 型 指令 , 工 型 运算 类 指令 和 
sw 指令 的 CPI 都 是 4;lw 指令 的 CPI 为 5; 分 支 指令 和 跳 转 指令 的 CPI 为 3。 

7. 控制 逻辑 单元 的 实现 

根据 不 同 的 控制 描述 方式 ,可 以 有 硬 连 线路 控制 器 和 微 程 序 控制 器 两 种 实现 方式 。 

硬 连 线路 控制 器 的 基本 实现 思路 : 将 指令 执行 过 程 中 每 个 时 钟 周 期 所 包含 的 控制 信号 
取 值 组 合 看 成 一 个 状态 ,每 来 一 个 时 钟 ,控制 信号 会 有 一 组 新 的 取 值 ,也 就 是 一 个 新 的 状态 ， 
这 样 ,所 有 指令 的 执行 过 程 就 可 以 用 一 个 有 限 状态 转换 图 来 描述 。 实 现时 ,用 一 个 组 全 逻辑 
电路 (一 般 为 PLA 电路 ) 来 生成 控制 信号 ,用 一 个 状态 寄存 器 实现 状态 之 间 的 转换 。 

微 程序 控制 器 的 基本 实现 思路 : 将 指令 执行 过 程 中 每 个 时 钟 周期 所 包含 的 控制 信号 取 
值 组 合 看 成 是 一 个 0/1 序列 ,每 个 控制 信号 对 应 一 个 微 命令 ,控制 信号 取 不 同 的 值 ,就 发 出 
不 同 的 微 命令 。 这 样 ,若干 微 命令 组 合成 一 个 微 指令 ,每 条 指令 所 包含 的 动作 就 由 若干 条 微 
指令 来 完成 。 指 令 执 行 时 , 先 找 到 对 应 的 第 一 条 微 指令 ,然后 按照 特定 的 顺序 取出 后 续 的 微 
指令 执行 。 每 来 一 个 时 钟 ,执行 一 条 微 指令 。 实 现时 ,每 条 指令 对 应 的 微 指令 序列 ( 称 为 微 
程序 ) 事 先 存 放 在 一 个 只 读 存储 器 ( 称 为 控制 存储 器 ,简称 控 存 ) 中 ,用 一 个 PLA 电路 或 
ROM 来 生成 每 条 指令 对 应 的 微 程序 的 第 一 条 微 指令 地 址 ,用 相应 的 微 程序 定 序 器 来 控制 
微 指令 执行 流程 。 微 程序 定 序 器 的 实现 有 计数 器 法 和 断定 法 ( 即 下 址 字段 法 ) 两 种 。 

8. 内 部 异常 和 外 部 中 断 

在 程序 正常 执行 过 程 中 ,CPU 会 遇 到 一 些 特殊 情况 而 无 法 继续 执行 当前 程序 。 这 种 中 
断 程序 正常 执行 的 情况 主要 有 两 大 类 : 内 部 异常 和 外 部 中 断 。 
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内 部 异常 指 CPU 内 部 在 执行 某 条 指令 时 发 生 的 程序 异常 或 硬件 异常 ,有 故障 .陷阱 和 
终止 三 种 类 型 ,也 被 称 为 程序 性 中 断 或 软 中 断 。@D 故 障 是 指 某 条 正在 执行 的 指令 产生 的 异 
常 ,如 “ 洲 出 “除数 为 0” 非法 操作 码 “ 缺 页 “地 址 越界 “访问 越权 ”“ 段 不 存在 “ 栈 溢出 ” 
等 ,有 些 故障 修复 后 程序 可 以 继续 执行 下 去 ,有 些 故障 不 能 修复 ,只 能 中 止 发 生 异 常 的 程序 
的 执行 , 若 修 复 后 程序 能 继续 执行 下 去 , 则 异常 处 理 后 通常 回 到 发 生 故 障 的 指令 重新 执行 ; 
@ 陷 阱 是 预先 安排 的 一 种 “异常 "事件 ,例如 断 点 设置 . 单 步 跟踪 、 系 统 调用 、 条 件 自 陷 等 , 通 
常 异常 处 理 后 回 到 被 中 断 处 下 一 条 指令 执行 ; @ 终 止 指 严重 的 硬件 故障 ,一 旦 发 生 只 能 终 
止 整个 系统 的 运行 ,重启 系统 。 

外 部 中 断 是 指 外 设 或 其 他 机 器 通过 中 断 请 求 线 向 CPU 提出 的 处 理 请 求 , 它 与 指令 的 
执行 无 关 。 它 作为 外 设 的 一 种 1/0 方式 ,能 带 来 CPU 和 外 设 在 一 定 程度 上 的 并 行 性 。 有 
关外 部 中 断 的 内 容 主要 在 第 8 章 介 绍 。 


5.3 基本 术语 解释 


指令 周期 (instruction cycle) 

从 取出 一 条 指令 执行 到 取 下 一 条 指令 执行 的 间隔 时 间 。 因 此 ,一 般 把 一 条 指令 从 存储 
器 读 出 到 执行 完成 所 用 的 全 部 时 间 称 为 指令 周期 。 一 个 指令 周期 中 要 完成 多 个 步骤 的 操 
作 , 包 括 取 指令 .指令 译 码 .计算 操作 数 地 址 、 取 操作 数 .运算 . 送 结果 .中断 检测 等 。 

机 器 周期 (machine cycle) 

在 一 个 指令 周期 中 ,最 复杂 的 操作 是 访问 存储 器 取 指 令 或 读 / 写 数据 或 者 访问 1/O 接 
口 以 读 / 写 数据 。 它 们 都 涉及 总 线 操作 ,通过 系统 总 线 来 和 CPU 之 外 的 部 件 进行 信息 交 
换 。 因 此 ,通常 把 CPU 通过 一 次 总 线 事务 访问 一 次 主 存 或 1/0 接口 的 时 间 称 为 机 器 周期 。 

一 个 指令 周期 包含 了 多 个 机 器 周期 。 不 同 机 器 的 指令 周期 所 包含 的 机 器 周期 数 不 同 。 
典型 的 机 器 周期 有 取 指 令 , 主 存 读 ( 间 址 周期 是 一 种 主 存 读 机 器 周期 ). 主 存 写 .IVO 读 .IO 
写 .中 断 响应 等 。 一 台 计 算 机 的 机 器 周期 类 型 是 确定 的 。 

现代 计算 机 采用 CPU 片 内 cache 来 存放 指令 和 数据 ,指令 和 数据 的 获取 、 数 据 的 运算 
和 传输 都 非常 快 ,所 以 ,一 条 指令 的 执行 在 若干 个 时 钟 内 就 可 以 完成 ,不 再 将 指令 周期 细 分 
为 若干 机 器 周期 。 

同步 系统 (synchronous system) 

系统 中 所 有 的 动作 都 有 专门 的 时 序 信号 来 定时 ,最 基本 的 时 序 信号 就 是 时 钟 ,同步 系统 
通过 时 钟 规 定 何 时 发 出 什么 动作 。 例 如 ,在 CPU 内 部 ,一 个 指令 的 执行 要 完成 数据 信息 的 
读 / 写 .内 部 数据 的 传送 或 运算 等 。 因 此 ,指令 的 执行 过 程 必须 分 解 成 若干 步骤 和 相应 的 动 
作 来 完成 ,每 一 步 动 作 都 要 有 相应 的 控制 信号 进行 控制 ,这 些 控制 信号 何 时 发 出 .作用 时 间 
多 长 ,都 要 有 相应 的 定时 信号 进行 同步 。 

时 序 信号 (timing signal) 

时 序 信 号 指 同 步 系统 中 用 于 进行 同步 控制 的 定时 信号 。 早 期 计算 机 在 处 理 器 设计 时 ， 
采用 机 器 周期 一 节拍 一 工作 脉冲 三 级 时 序 系统 。 现 代 计算 机 一 般 只 用 一 个 专门 的 时 钟 信号 
来 进行 定时 。 因 此 ,现代 计算 机 的 时 序 信 号 就 是 时 钟 信号 。 


由 天 处 理 器 


控制 单元 (Control Unit, CU) 

也 称 为 控制 部 件 ,控制 逻辑 或 控制 器 。 其 作用 是 对 指令 进行 译 码 ,将 译 码 结果 和 状态 / 
标志 信号 和 时 序 信号 等 进行 组 合 ,产生 各 种 操作 控制 信号 。 这 些 控制 信号 被 送 到 CPU 内 
部 或 通过 总 线 送 到 主 存 或 1/0 模块 。 送 到 CPU 内 部 的 控制 信号 用 于 控制 CPU 内 部 数据 
通路 的 执行 , 送 到 主 存 或 I/O 模块 的 信号 控制 CPU 和 主 存 或 CPU 和 1/O 模块 之 间 的 信息 
交换 。 控 制 单元 是 整个 CPU 的 指挥 控制 中 心 ,通过 规定 各 部 件 在 何 时 做 什么 动作 来 控制 
数据 的 流动 ,以 完成 指令 的 执行 。 

执行 部 件 (Execute Unit, EU) 

执行 部 件 也 称 为 操作 部 件 或 功能 部 件 , 由 控制 部 件 CU 发 来 的 操作 控制 信号 进行 控制 ， 
以 完成 特定 的 功能 。 有 两 种 类 型 的 执行 部 件 , 一 种 是 用 组 合 敢 辑 电 路 实现 的 “操作 元 件 ”, 用 
于 进行 数据 运算 数据 传送 等 ,如 ALU ,总 线 .扩展 器 、 多 路 选择 器 等 ; 另 一 种 是 用 时 序 逻 辑 
电路 实现 的 “状态 元 件 ”, 用 于 进行 数据 存储 ,如 触发 器 .寄存 器 .存储 器 等 。 

组 合 逻 辑 电 路 (combinational logic circuit) 

简称 组 合 电路 ,用 来 构成 “操作 元 件 "。 组 合 敢 辑 电 路 在 逻辑 功能 上 的 特点 是 ,任意 时 刻 
的 输出 仅仅 取决 于 该 时 刻 的 输入 ,与 电路 原来 的 状态 无 关 , 因 此 , 它 没有 存储 功能 。 

时 序 逻 辑 电 路 (sequential logic circuit) 

简称 时 序 电路 ,用 来 构成 “状态 元 件 ”。 时 序 刻 辑 电 路 在 风 辑 功能 上 的 特点 是 ,任意 时 刻 
的 输出 不 仅 取 决 于 当时 的 输入 信号 ,而 且 还 取决 于 电路 原来 的 状态 ,或 者 说 ,还 与 以 前 的 输 
和 人 有关。 时 序 迪 辑 电路 具有 存储 功能 ,能 保存 所 存储 的 状态 。 

扩展 器 (extension unit) 

将 一 个 nn 位 数 扩展 成 27 位 数 的 部 件 。 一 般 有 两 种 扩展 方式 :“ 零 ”扩展 和 “符号 ”扩展 。 

“ 零 " 扩 展 (0-extend) 

高 n 位 用 0 填充 。 例 如 ,在 MIPS 指令 系统 中 ,一 个 16 位 的 逻辑 数 需 先进 行 零 扩展 , 扩 
展 为 32 位 数 后 ,在 32 位 ALU 中 进行 逻辑 运算 。 零 扩展 可 以 看 成 是 对 无 符号 数 的 扩展 , 扩 
展 前 后 数值 不 变 。 

“符号 ?扩展 (sign extend) 

高 n 位 用 扩展 前 的 n 位 数 的 符号 位 填充 。 例 如 ,在 MIPS 指令 系统 中 ,Load/Store 指令 
中 的 存储 器 地 址 偏 移 量 需 先进 行 “符号 扩展 ,将 16 位 偏 移 量 扩展 为 32 位 后 , 送 到 32 位 的 
ALU 中 ,和 基 址 进行 加 法 运算 。“ 符 号 ”扩展 可 以 看 成 是 对 带 符号 整数 扩展 ,扩展 前 后 数值 
不 变 。 

多 路 选择 器 (multiplexor) 

也 称 数据 选择 器 或 多 路 复 用 器 。 它 根据 控制 线路 的 设置 ,选择 多 个 输入 信号 中 的 一 个 
进行 输出 。 

定时 方式 (clocking methodology) 

在 时 序 电路 中 ,定时 方式 规定 了 状态 存储 元 件 何 时 读 出 信号 , 何 时 写 和 信号。 一 般 采 用 
边沿 触发 的 定时 方式 。 

边沿 触发 (edge-triggered) 

规定 存储 元 件 中 的 状态 只 允许 在 时 钟 跳 变 边沿 改变 。 时 钟 信号 的 跳 变 有 正 跳 变 和 负 跳 
变 两 种 。 在 时 钟 的 上 升 沿 进行 的 跳 变 为 正 跳 变 ,在 时 钟 的 下 降 沿 进行 的 跳 变 为 负 跳 变 。 
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寄存 器 堆 (register file) 

寄存 器 堆 就 是 寄存 器 集合 ,因此 也 称 为 通用 寄存 器 组 (GRS) 。 其 中 的 寄存 器 可 以 通过 
给 定 相应 的 寄存 器 编号 来 进行 读 写 。 在 指令 中 用 编号 标识 寄存 器 。 执 行 指令 时 ,指令 中 的 
寄存 器 编号 被 送 到 一 个 地 址 译 码 器 进行 译 码 , 选 中 某 个 寄存 器 进行 写 入 , 读 出 时 寄存 器 编号 
作为 控制 信号 来 控制 一 个 多 路 选择 器 ,选择 相应 的 寄存 器 读 出 。 实 质 上 它 是 CPU 中 暂时 
存放 数据 的 地 方 ,里 面 保存 着 那些 等 待 处 理 的 数据 或 已 经 处 理 过 的 数据 ,CPU 访问 寄存 器 
所 用 的 时 间 要 比 访问 内 存 的 时 间 短 。 采 用 寄存 器 ,可 以 减少 CPU 访问 内 存 的 次 数 ,从 而 加 
快 指令 执行 的 速度 。 不 过 ,因为 受到 芯片 面积 和 集成 度 的 限制 ,寄存 器 堆 的 容量 不 可 能 
很 大 。 

寄存 器 写 信 号 (register write) 

寄存 器 堆 中 的 寄存 器 是 由 触发 器 构成 的 ,而 触发 器 的 输出 状态 的 变化 只 能 发 生 在 时 钟 
边沿 ,因此 寄存 器 写 控制 信号 在 时 钟 边 沿 有 效 。 时 钟 边沿 到 来 时 ,事先 稳定 在 输入 端的 数据 
开始 向 寄存 器 写 人 ,经 过 一 段 时 间 延 迟 (这 个 延迟 时 间 称 为 Click-to-Q) 才 能 稳定 地 写 人 到 
寄存 器 并 输出 ,因此 ,时 钟 边沿 到 来 时 ,在 寄存 器 输出 端的 数据 实际 上 还 是 上 一 个 时 钟 周期 
内 的 老 数据 。 

指令 存储 器 (instruction memory) 

专门 存放 指令 的 存储 器 ,也 称 为 代码 存储 器 (Code Memory)。 实 际 上 ,现代 计算 机 中 ， 
CPU 内 的 一 级 cache 采用 数据 cache 和 代码 cache 分 离 的 方式 ,因此 指令 存储 器 实际 上 是 
CPU 中 的 代码 cache。 

数据 存储 器 (data memory) 

专门 存放 数据 的 存储 器 。 实 际 上 ,现代 计算 机 中 ,CPU 内 的 一 级 cache 采用 数据 cache 
和 代码 cache 分 离 的 方式 ,因此 数据 存储 器 实际 上 是 处 理 器 中 的 数据 cache。 

指令 译 码 器 (instruction decoder) 

用 来 对 指令 的 操作 码 进行 译 码 的 部 件 。 在 设计 指令 系统 时 ,对 每 条 功能 不 同 的 指令 操 
作 码 进行 了 编码 。 因 此 ,执行 指令 时 ,必须 要 有 相应 的 译 码 电路 对 每 个 操作 码 进 行 译 码 解 
释 。 指 令 译 码 器 的 输入 是 指令 操作 码 ,输出 结果 用 来 和 其 他 信号 (如 时 序 信号 、 机 器 状态 信 
号 .指令 结果 标志 信号 等 ) 一 起 组 合生 成 控制 信号 。 不 同 的 指令 译 码 结果 生成 控制 信号 的 不 
同 取 值 , 以 控制 执行 部 件 完成 不 同 的 功能 。 

控制 信号 (control signal) 

控制 信号 也 称 为 操作 控制 信号 或 微 操作 信号 。 控 制 器 中 的 指令 译 码 器 对 指令 进行 译 
码 ,将 译 码 结果 和 状态 /标志 信号 .时序 信 号 等 进行 组 合 , 产 生 各 种 操作 控制 信号 。 这 些 控制 
信号 被 送 到 CPU 内 部 或 通过 总 线 送 到 主 存 或 IO 模块 。 送 到 CPU 内 部 的 控制 信号 用 于 
控制 CPU 内 部 数据 通路 的 执行 , 送 到 主 存 或 1/O 模块 的 信号 控制 CPU 和 主 存 或 CPU 和 
I/O 模块 之 间 的 信息 交换 。 

时 钟 周期 (clock cycle) 

现代 计算 机 的 CPU 采用 时 钟 信号 进行 定时 控制 。 若 采用 时 钟 边沿 触发 , 则 只 有 在 时 
钟 的 上 升 沿 或 下 降 沿 到 来 时 ,才能 把 一 个 新 的 值 写 到 一 个 状态 单元 中 。 所 以 CPU 的 时 钟 
周期 应 该 为 所 有 相 邻 状态 单元 之 间 的 组 合 逻辑 电路 中 最 长 的 延 时 作为 时 钟 周期 ,以 保证 在 
一 个 时 钟 周期 内 所 有 的 组 合 电路 能 完成 必要 的 数据 处 理工 作 。 





史 风 处理 器 


主 频 (CPU clock rate/frequency) 

CPU 的 主 频 就 是 CPU 时 钟 周期 的 倒数 。 

分 支 条 件 满足 (branch taken) 

对 于 条 件 转移 指令 ( 即 分 支 指令 Branch) ,其 执行 结果 总 有 两 种 可 能 性 ( 即 两 个 分 支 或 
两 条 执行 路 径 ) ; 一 种 是 条 件 满足 ( 称 为 “Branch taken”) ,此 时 跳 转 到 转移 目标 地 址 处 继续 
执行 ; 另 一 种 是 条 件 不 满足 ( 称 为 “Branch not taken”) ,此 时 则 继续 取 下 条 指令 执行 。 

转移 目标 地 址 (branch target address) 

对 于 转移 指令 (包括 条 件 转移 指令 ,无条件 转移 指令 .转子 指令 等 ) ,其 指令 中 给 出 目标 
地 址 , 称 为 转移 目标 地 址 。 数 据 通路 中 必须 要 有 相应 的 部 件 能 够 计算 转移 目标 地 址 ,并 根据 
情况 选择 将 转移 目标 地 址 送 到 PC 中 ,作为 下 一 条 执行 指令 的 地 址 。 

硬 布线 控制 器 (hardwared control) 

硬 布线 控制 器 是 指 采用 组 合 逻 辑 电路 和 状态 寄存 器 进行 设计 实现 的 控制 器 ,也 称 为 硬 
连 线路 控制 器 。 在 多 周期 数据 通路 中 ,一 条 指令 的 执行 分 多 个 阶段 进行 ,每 个 阶段 在 一 个 时 
钟 周期 内 完成 ,如 果 把 每 个 阶段 涉及 的 控制 信号 组 合 看 成 是 一 个 状态 , 则 一 个 阶段 转移 到 下 
一 个 阶段 ,就 可 以 看 成 是 状态 之 间 的 转换 ,因此 ,所 有 指令 的 执行 过 程 就 可 以 用 一 个 有 限 状 
态 机 来 描述 ,控制 器 的 功能 就 是 实现 这 个 有 限 状态 机 。 因 此 ,这 种 控制 器 设计 方式 也 称 为 有 
限 状 态 机 方式 ,实现 的 控制 器 称 为 有 限 状 态 机 控制 器 。 它 的 优点 是 速度 快 ,适合 于 实现 简单 
或 规整 的 指令 系统 。 但 是 ,因为 它 是 一 个 多 输入 /多 输出 的 巨大 的 多 辑 网 络 ,所 以 ,对 于 复杂 
的 指令 系统 来 说 ,其 结构 庞杂 ,实现 困难 ,修改 .维护 不 易 , 灵 活性 差 。 

微 程序 控制 器 (microprogrammed control) 

采用 微 程序 设计 方式 实现 的 控制 器 称 为 微 程序 控制 器 。 微 程序 设计 的 基本 思想 是 , 仿 
照 程序 设计 的 方法 编制 每 个 机 器 指令 对 应 的 微 程序 ,每 个 微 程序 由 若干 条 微 指令 构成 ,每 条 
微 指 令 就 是 有 限 状 态 机 中 对 应 的 一 个 状态 , 即 若 干 控制 信号 的 集合 ,所 以 每 个 微 指令 包含 若 
干 条 微 命令 ,这 些微 命令 实际 上 就 是 控制 信号 。 所 有 指令 对 应 的 微 指令 序 列 都 放 在 只 读 存 
储 器 中 。 当 执行 到 某 条 指令 时 ,取出 对 应 的 各 条 微 指令 , 译 码 产生 对 应 的 微 命令 ( 即 控 制 信 
号 ) , 送 到 数据 通路 中 相应 的 地 方 ,控制 其 动作 。 这 个 只 读 存 储 器 称 为 控制 存储 器 (Control 
Storage,CS) ,简称 控 存 。 

微 代 码 (microcode) 

通常 把 事先 存放 在 控制 存储 器 CS 中 的 微 程序 代码 ( 即 每 个 控 存 单元 中 的 0/1 序列 ) 称 
为 微 代码 或 微 码 。 

微 指令 (microinstruction) 

微 指令 和 微 代码 的 含义 实际 上 是 一 样 的 ,只 是 同一 个 概念 从 不 同 的 角度 来 讲 而 已 。 控 
存 中 每 个 单元 存放 一 条 微 指令 ,对 应 于 有 限 状态 机 中 的 一 个 状态 ,每 条 微 指 令 在 一 个 时 钟 周 
期 内 完成 。“ 微 指令 ”与 程序 设计 中 “指令 ”的 概念 类 似 ,也 涉及 格式 和 顺序 控制 等 问题 。 

微 程 序 (microprogram) 

类 似 于 程序 设计 中 “程序 ”的 概念 ,程序 用 于 实现 某 个 特定 的 算法 功能 ,而 微 程序 用 于 实 
现 机 器 的 指令 ;程序 由 若干 指令 构成 ,而 微 程序 由 若干 条 微 指令 构成 ;程序 存放 在 内 存 中 ,而 
微 程序 存放 在 控制 存储 器 中 。 


地 上 油 
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件 (firmware) 

一 般 把 写 入 EPROM 等 只 读 存 储 器 中 的 程序 称 为 固件 ,最 初 把 固化 在 只 读 存储 器 的 微 
程序 称 为 固件 ,表示 用 软件 实现 的 硬 部 件 ,现在 对 固件 通俗 的 理解 就 是 在 ROM 中 “固化 的 
软件 ”。 它 是 固化 在 集成 电路 内 部 的 程序 代码 ,负责 控制 和 协调 集成 电路 的 功能 。 

中 断 过 程 (interrupt processing) 

中 断 过 程 是 一 个 正常 执行 的 程序 被 打 断 的 过 程 。 指 在 程序 正常 执行 过 程 中 ,CPU 遇 到 
一 些 异常 情况 无 法 继续 执行 当前 指令 ,或 者 ,外 部 设备 发 生 一 些 特殊 事件 请 求 CPU 处 理 。 
此 时 ,CPU 中 止 原来 正在 执行 的 程序 , 转 到 处 理 异 常情 况 或 特殊 事件 的 处 理 程序 去 执行 , 执 
行 后 再 返回 到 原 被 中 止 的 程序 继续 执行 。 中 断 过 程 的 起 因 主要 有 来 自 处 理 器 外 部 的 “中 断 ” 
和 来 自 处 理 器 内 部 的 “异常 "两 种 。 

中 断 请 求 (interrupt request) 

中 断 请 求 是 引起 中 断 过 程 的 原因 之 一 。 在 程序 执行 过 程 中 , 若 外 设 完成 任务 或 发 生 某 
些 特 殊 事件 (如 打印 机 缺 纸 、. 定 时 采样 计数 时 间 到 ,键盘 缓冲 满 等 ), 会 向 CPU 发 中 断 请 求 ， 
要 求 CPU 对 这 些 情况 进行 处 理 。 处 理 完 后 , 回 到 原 被 中 断 的 断 点 处 继续 执行 。 这 种 情况 
也 被 称 为 1O 中 断 (I1/O interrupt) 。 特 指 由 CPU 外 部 的 IO 设备 向 CPU 发 的 中 断 请 求 。 
它 与 执行 的 指令 无 关 ,是 异步 发 生 的 外 部 事件 。 因 此 ,也 称 为 “外 部 中 断 ”。 

异常 (exception) 

异常 是 引起 中 断 过 程 的 原因 之 一 。 在 CPU 执行 某 条 指令 时 发 生 的 一 些 特殊 的 非 正常 
事件 (如 缺 页 ,溢出 ,除数 为 0、 非 法 操作 码 等 ) 都 称 为 一 种 异常 。 它 是 来 自 处 理 器 内 部 的 意 
外 事件 ,由 正在 执行 的 指令 同步 产生 的 特殊 事件 。 也 称 为 * 内 部 异常 "或 “内 中 断 ” 或 “程序 性 
中 断 ”, 它 又 可 以 细 分 为 三 类 : 故障 、 自 陷 、 终 止 。 

故障 (fault) 

在 执行 某 条 指令 时 ,可 能 发 生 一 些 特殊 的 “异常 事件 ”, 如 缺 页 ,溢出 .除数 为 0, 非法 操 
作 码 等 ,使 当前 指令 无 法 继续 执行 。 此 时 CPU 只 能 中 止 原 程序 的 执行 , 转 到 处 理 相应 情况 
的 程序 去 执行 ,处 理 完 后 ,再 回 到 发 生 异 常 的 指令 继续 执行 。 这 种 情况 被 称 为 故障 (fault) ， 
它 是 由 正在 执行 的 指令 产生 的 。 

自 陷 (trap) 

自 陷 是 人 为 设 定 的 事件 ,在 程序 中 事先 设 定 一 条 特殊 的 指令 ,通过 执行 这 条 特殊 指令 ， 
自动 中 止 正在 执行 的 原 程序 , 转 到 一 个 特定 的 内 核 管理 程序 去 执行 ,执行 完 后 , 回 到 那 条 特 
殊 指令 后 面 的 一 条 指令 开始 执行 。 自 陷 也 称 为 自愿 中 断 或 陷阱 。 这 些 特殊 的 指令 称 为 “ 访 
管 指令 "(访问 管理 程序 ) 或 “ 自 陷 指 令 ”( 自 动 掉 入 陷阱 ) 或 “陷阱 指令 ”, 如 x86 中 的 指令 
INT n。 

终止 (abort) 

既 不 是 外 部 设备 发 出 的 中 断 请 求 , 也 不 是 指令 本 身 产生 的 异常 情况 或 自愿 中 断 ,而 是 在 
执行 指令 过 程 中 发 生 了 硬件 故障 ,如 电源 掉 电线 路 故障 等 ,无 法 继续 执行 。 这 类 异常 是 随 
机 发 生 的 ,对 引起 异常 的 指令 的 确切 位 置 无 法 确定 ,出 现 这 类 严重 错误 时 , 原 程序 无 法 继续 
执行 ,只 好 终止 ,而 由 中 断 服务 程序 重新 启动 操作 系统 。 

中 断 服务 程序 (interrupt handler) 

也 称 为 中 断 处 理 程序 或 异常 处 理 程序 。 当 CPU 发 现 外 部 中 断 或 内 部 异常 时 ,就 会 把 


放风 处理 器 


当前 正在 执行 的 用 户 程序 停 下 来 , 调 出 处 理 异 常 或 中 断 的 程序 来 执行 ,这 个 程序 就 是 中 断 服 
务 程序 。 中 断 服务 程序 属于 操作 系统 内 核 部 分 ,所 以 ,发 生 中 断 或 异常 时 ,CPU 的 状态 要 从 
用 户 态 ( 即 执行 用 户 程序 的 状态 ,也 称 为 目 态 ) 切 换 到 管理 态 ( 即 执行 操作 系统 管理 程序 ,也 
称 为 管 态 ,内核 态 或 核心 态 ) 。 

异常 程序 计数 器 EPC(Exception PC) 

MIPS 处 理 器 中 用 于 保存 出 错 指令 或 中 断 返 回 后 所 执行 指令 的 地 址 的 寄存 器 。 它 的 位 
数 和 PC 的 位 数 一 样 。 通 常 把 这 个 被 保存 的 地 址 称 为 断 点 ,把 这 个 地 址 送 到 EPC 的 过 程 称 
为 保存 断 点 。 

原因 寄存 器 (cause register) 

用 于 记录 异常 或 中 断 类 型 的 状态 寄存 器 。 每 一 位 的 含义 应 事先 规定 ,例如 ,第 1 位 为 1 
则 表示 出 现 了 “溢出 ”异常 ,第 二 位 为 1 则 表示 出 现 了 * 非 法 指令 ”, 第 三 位 为 1 则 是 “ 缺 页 ”， 
等 等 。 在 外 部 接口 (如 中 断 控制 器 ) 中 也 有 类 似 的 状态 寄存 器 ,用 以 记录 中 断 请 求 的 类 型 ,一 
般 称 为 中 断 请 求 寄 存 器 。 

中 断 允许 触发 器 (interrupt enable register) 

在 CPU 中 用 来 设置 中 断 允 许 /中 断 禁 止 状态 的 触发 器 。 关 中 断 时 ,中 断 允 许 触 发 器 被 
设置 为 0, 表示 不 允许 响应 中 断 。 开 中 断 时 ,中 断 允 许 触 发 器 被 设置 为 1, 表 示人 允许 响应 
中 断 。 

关中 断 (interrupt OFF) 

将 中 断 允许 触发 器 设置 为 0 的 操作 ,表示 不 允许 响应 中 断 。 

开 中 断 (interrupt ON) 

将 中 断 允许 触发 器 设置 为 1 的 操作 ,表示 允许 响应 中 断 。 

中 断 响应 (interrupt response) 

是 指 CPU 发 现 有 中 断 请 求 到 取出 中 断 服务 程序 的 入 口 地 址 准备 执行 中 断 服务 程序 的 
过 程 。CPU 总 是 在 一 条 指令 执行 完 , 取 下 条 指令 之 前 去 查询 有 无 中 断 请 求 。 如 果 此 时 是 开 
中 断 状态 ,并 有 未 被 屏蔽 的 中 断 请 求 发 生 , 则 CPU 自动 执行 一 条 隐 指 令 , 进 入 中 断 响应 周 
期 ,以 完成 关中 断 \ 保 护 断 点 、 取 中 断 向 量 三 个 操作 。 

向 量 中 断 (vector interrupt) 

是 指 一 种 识别 中 断 源 的 技术 或 方式 。 识 别 中 断 源 的 目的 就 是 要 找到 中 断 源 对 应 的 中 断 
服务 程序 的 入 口 地 址 , 即 获 得 向 量 地 址 。 采 用 向 量 中 断 进行 中 断 源 识别 的 做 法 是 ,采用 某 种 
硬件 排队 线路 (如 菊花 链 、 并 行 判 优 等 ), 对 所 有 未 被 屏蔽 的 中 断 请 求 进行 排队 , 选 出 优先 级 
最 高 的 中 断 源 ,然后 对 其 编码 ,得 到 该 中 断 源 的 编号 (可 以 转换 为 向 量 地 址 ,有 些 书 中 就 称 其 
为 向 量 地 址 ) ,通过 总 线 将 其 取 到 CPU 中 ,转换 成 向 量 地 址 ,从 而 取出 中 断 服务 程序 入 口 地 
址 ,或 跳 转 到 中 断 服务 程序 。 还 有 一 种 中 断 源 识别 方式 是 用 程序 ( 称 为 中 断 查询 程序 ) 进 行 
识别 的 软件 方法 。 

中 断 向 量 (interrupt vector) 

每 个 中 断 源 都 有 对 应 的 处 理 程序 ,我 们 称 这 个 处 理 程序 为 中 断 服务 程序 ,其 入 口 地 址 称 
为 中 断 向 量 。 

中 断 向 量 表 (interrupt vector table) 

所 有 中 断 ( 包 括 异 常 ) 的 中 断 服务 程序 入 口 地 址 构成 一 个 表 , 称 为 中 断 向 量 表 ; 也 有 的 机 
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器 把 中 断 服务 程序 人 口 的 跳 转 指令 构成 一 张 表 , 称 为 中 断 向 量 跳 转 表 。 
向 量 地 址 (vector address) 
中 断 向 量 表 或 中 断 向 量 跳 转 表 中 每 个 表 项 所 在 的 内 存 地 址 称 为 向 量 地 址 。 
中 断 类 型 号 (interrupt number) 
中 断 向 量 表 或 中 断 向 量 跳 转 表 中 每 个 表 项 所 在 的 表 项 索引 值 称 为 中 断 类 型 号 。 


5.4 常见 问题 解答 


1， 从 事 CPU 设计 的 人 会 很 少 ,为 什么 大 家 都 要 学 习 如 何 设计 CPU 呢 ? 

答 : 首先 ,从 智力 方面 来 说 ,处 理 器 设计 是 有 趣 而 富有 挑战 性 的 。“ 现 代 微 处 理 器 可 以 
称 得 上 是 人 类 创造 出 的 最 复杂 的 系统 之 一 ”,“ 处 理 器 要 完成 复杂 的 任务 ,但 又 要 求 结构 尽 可 
能 简单 ”; 其 次 ,理解 处 理 器 如 何 工作 能 够 帮助 理解 整个 计算 机 系统 是 如 何 工作 的 。 第 三 , 虽 
然 不 会 有 很 多 人 设计 处 理 器 ,但 会 有 很 多 人 从 事 嵌 入 式 系统 的 设计 。 现 代 许 多 机 电 产 品 中 
都 有 处 理 器 芯片 嵌入 其 中 , 绕 入 式 系统 的 设计 者 必须 了 解 处 理 器 是 如 何 工作 的 ,因为 这 些 系 
统 通常 在 较 低 的 抽象 层次 上 进行 编程 设计 。 第 四 ,你 将 来 的 工作 可 能 就 是 设计 处 理 器 . 

现代 计算 机 的 处 理 器 基本 上 都 采用 流水 线 方式 执行 指令 ,流水 线 方式 的 数据 通路 比较 
复杂 ,所 以 先 从 简单 的 单 周期 数据 通路 和 多 周期 数据 通路 开始 理解 ,就 是 本 章 的 内 容 。 有 了 
这 些 基础 ,对 流水 线 处 理 器 理解 起 来 就 较 容易 了 。 深 刻 理解 流水 线 方式 处 理 器 的 工作 原理 
对 于 如 何 设计 高 质量 的 程序 .如何 进行 编译 优化 ,如何 设 计 高 性 能 计算 机 系统 等 都 是 非常 必 
要 的 。 

2. 一 条 指令 的 执行 过 程 中 要 做 哪些 事情 呢 ? 

答 : 一 条 指令 的 执行 过 程 包括 : 取 指 令 、 指 令 译 码 .计算 操作 数 地 址 、 取 操作 数 、 运 算 、 
送 结果 。 其 中 取 指 令 和 指令 译 码 是 每 条 指令 都 必须 进行 的 操作 。 有 些 指令 需要 到 存储 单元 
取 操作 数 , 因 此 ,需要 在 取 数 之 前 计算 操作 数 所 在 的 存储 单元 地 址 。 取 操作 数 和 送 结果 这 两 
个 步骤 ,对 于 不 同 的 指令 ,其 取 和 送 的 地 方 可 能 不 同 , 有 些 指令 要 求 在 寄存 器 读 取 /保存 数 
据 , 有 些 是 在 内 存单 元 中 读 取 / 保 存 数据 ,还 有 些 是 对 1/O 端口 进行 读 取 或 保存 数据 。 因 
此 ,一 条 指令 的 执行 阶段 (不 包括 取 指 令 阶段 ), 可 能 只 有 CPU 参与 ,也 可 能 要 通过 总 线 去 
访问 主 存 ,也 可 能 要 通过 总 线 去 访问 1/O 端口 。 

3. CPU 总 是 在 执行 指令 吗 ? 会 不 会 停 下 来 什么 都 不 做 ? 

答 : CPU 的 功能 就 是 不 断 地 周而复始 地 执行 指令 ,而 每 条 指令 又 都 有 不 同 的 步骤 ,每 
个 步骤 在 一 定 的 时 间 内 完成 。 因 此 ,CPU 总 是 在 不 停 地 执行 指令 。 有 时 我 们 会 说 ,CPU 停 
止 或 CPU 正在 等 待 ,什么 事情 也 不 做 。 事 实 上 ,CPU 还 是 在 执行 指令 ,只 不 过 可 能 处 于 以 
下 几 种 情况 之 一 : (1)CPU 正在 执行 某 条 指令 的 过 程 中 ,发 生 了 诸如 cache 缺失 这 样 需要 访 
问 内 存 或 1/O 端口 的 事件 ,此 时 ,当前 正在 执行 的 指令 无 法 继续 执行 到 下 一 步 ,因此 ,CPU 
就 处 于 等 待 (阻塞 ) 状 态 ,直到 主 存 或 1O 完成 读 写 操作 ; (2)CPU 正在 不 断 地 通过 执行 指 
令 , 以 查询 外 设 是 否 就 绪 , 在 查询 过 程 中 ,CPU 什么 实质 性 的 工作 都 没有 做 ; (3)CPU 正在 
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执行 一 连 串 的 空 指令 (NOP) ,什么 实质 性 工作 都 没有 做 。 综 上 所 述 ,CPU 不 可 能 不 在 执行 
指令 ,只 是 指令 的 执行 过 程 被 阻塞 了 一 段 时 间或 执行 了 没有 产生 结果 的 指令 。 

4. CPU 除了 执行 指令 外 ,还 做 什么 事情 ? 

答 : CPU 的 工作 过 程 就 是 周而复始 地 执行 指令 ,计算 机 各 部 分 所 进行 的 工作 都 是 由 
CPU 根据 指令 的 要 求 来 启动 的 。 为 了 使 CPU 和 外 部 设备 能 够 很 好 地 协调 工作 ,尽量 使 
CPU 不 等 待 ,甚至 不 参与 外 部 设备 的 输入 和 输出 过 程 ,CPU 对 外 设 的 输入 输出 控制 采用 了 
程序 中 断 方 式 和 DMA 方式。 这 两 种 方式 下 ,外 部 设备 需要 向 CPU 提出 中 断 请求 或 DMA 
请 求 , 因 此 ,在 执行 指令 过 程 中 ,CPU 还 要 定时 通过 采样 相应 的 引 脚 来 查询 有 没有 中 断 请 求 
或 DMA 请 求 。 如 果 有 中 断 请 求 ,CPU 要 进行 一 系列 操作 来 完成 从 正在 执行 的 用 户 程序 到 
中 断 处 理 程序 的 切换 ;如 果 有 DMA 请 求 ,还 要 给 出 响应 DMA 请 求 的 一 些 控制 信号 。 另 
外 ,CPU 在 一 条 指令 的 执行 过 程 中 ,还 可 能 发 生 一 些 异常 事件 ,因此 ,也 需要 CPU 能 通过 相 
应 的 动作 ,转换 到 异常 事件 处 理 程序 去 执行 。 不 过 ,查询 或 响应 中 断 请 求 和 DMA 请 求 的 过 
程 都 是 包含 在 一 条 指令 执行 过 程 中 的 。 

5. 对 于 CPU 中 的 所 有 寄存 器 ,用 户 都 能 访问 吗 ? 

答 : CPU 中 的 寄存 器 分 为 用 户 可 访问 寄存 器 和 用 户 不 可 见 寄存 器 。 一 般 把 用 户 可 访 
问 寄存 器 称 为 通用 寄存 器 (GPR)。 这 些 寄存 器 都 有 一 个 编号 ,在 指令 中 用 编号 标识 寄存 
器 。 因 此 执行 指令 时 ,指令 中 的 寄存 器 编号 要 送 到 一 个 地 址 译 码 器 进行 译 码 , 然 后 才能 选中 
某 个 寄存 器 进行 读 写 。 通 用 寄存 器 可 以 用 来 存放 操作 数 或 运算 结果 ,或 作为 地 址 指针 、 变 址 
寄存 器 、 基 址 寄存 器 等 。 

CPU 中 有 一 些 寄存 器 是 用 户 不 可 见 的 ,没有 编号 ,不 能 通过 程序 直接 访问 。 如 指令 寄 
存 器 IR ,程序 状态 字 寄 存 器 PSWR ,存储 器 地 址 寄存 器 MAR ,存储 器 数据 寄存 器 MDR 等 。 

对 于 程序 计数 器 PC , 它 虽然 是 专用 寄存 器 ,没有 编号 ,不 能 在 指令 中 被 明确 指定 ,但 用 
户 可 以 通过 转移 类 指令 来 修改 其 值 , 以 改变 程序 执行 的 顺序 。 

6. CPU 执行 指令 的 过 程 中 ,其 他 部 件 在 做 什么 ? 

答 : 计算 机 的 工作 过 程 就 是 连续 执行 指令 的 过 程 ,整个 计算 机 各 个 部 分 的 动作 都 是 由 
CPU 中 的 控制 部 件 CU 通过 对 指令 译 码 送出 的 控制 信号 来 控制 的 。 其 他 部 件 不 知道 自己 
该 做 什么 ,该 完成 什么 动作 ,只 有 CPU 通过 对 指令 译 码 才 知道 。 如 果 指令 中 包含 有 对 存储 
器 或 IO 端口 的 访问 , 则 必须 由 CPU 通过 总 线 把 要 访问 的 地 址 和 操作 命令 ( 读 还 是 写 ) 等 
信息 送 到 存储 器 或 1/O 接口 来 启动 相应 的 读 或 写 操作 。 例 如 , 若 不 采用 cache, 则 每 次 指令 
执行 前 ,都 要 通过 向 总 线 发 出 主 在 地 址 、. 主 存 读 命令 等 来 控制 存储 器 取 指 令 ; 若 当前 执行 的 
是 寄存 器 定点 加 法 指令 , 则 CU 控制 定点 运算 器 进行 动作 ;若是 1/O 指令 , 则 CU 会 通过 总 
线 发 出 1/O 端口 地 址 ,1/O 读 或 写 命令 等 来 控制 对 某 个 I/O 接口 中 的 寄存 器 进行 读 写 操作 。 
所 以 说 ,CPU 在 执行 指令 时 ,其 他 部 件 也 可 能 在 执行 同样 的 指令 ,只 不 过 它们 各 司 其 职 : 
CU 负责 解释 指令 和 发 出 命令 (控制 信号 ) ,而 各 个 部 件 则 按 命 令 具 体 完成 自己 该 完成 的 任 
务 ( 如 读 写 、 运 算 等 )。 

7. 怎样 保证 CPU 能 按 程序 规定 的 顺序 执行 指令 呢 ? 

答 : 计算 机 的 工作 过 程 就 是 连续 执行 指令 的 过 程 ,指令 在 主 存 中 连续 存放 。 一 般 情况 
下 ,指令 被 顺序 执行 ,只 有 遇 到 转移 指令 (如 无 条 件 转移 、 条 件 分 支 . 调 用 和 返回 等 指令 ) 才 改 
变 指令 执行 的 顺序 。 当 执行 到 非 转 移 指令 时 ,CPU 中 的 指令 译 码 器 通过 对 指令 译 码 ,知道 
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正在 执行 的 是 一 种 顺序 执行 的 指令 ,所 以 就 直接 通过 对 PC 加 “1”( 这 里 的 “1” 是 指 一 条 指令 
的 长 度 ) 来 使 PC 指向 下 一 条 顺序 执行 的 指令 ; 当 执 行 到 转移 指令 时 ,指令 译 码 器 知道 正在 
执行 的 是 一 种 转移 指令 ,因而 ,控制 运算 器 根据 指令 执行 的 结果 进行 相应 的 地 址 运算 ,把 运 
算得 到 的 转移 目标 地 址 送 到 PC 中 ,使 得 执行 的 下 一 条 指令 为 转移 到 的 目标 指令 。 

由 此 可 以 看 出 ,指令 在 主 存 中 的 存放 顺序 是 静态 的 ,而 指令 的 执行 顺序 是 动态 的 。 
CPU 能 根据 指令 执行 的 结果 动态 改变 程序 的 执行 流程 。 

8. 定 长 指令 字 格 式 的 处 理 器 中 ,如 何 读 取 指 令 ? 

答 : 定 长 指令 字 格 式 是 一 种 规整 型 指令 集 格式 ,所 有 指令 都 有 相同 的 长 度 , 所 以 ,指令 
的 读 取 非 常 简单 。 每 次 都 可 以 按照 确定 的 字 节 个 数 从 指令 存储 器 中 读 出 指令 。 

9. 定 长 指令 字 格 式 的 处 理 器 中 ,下 一 条 指令 地 址 如 何 计算 ? 

答 : 定 长 指令 字 格 式 是 一 种 规整 型 指令 集 格式 ,所 有 指令 都 有 相同 的 长 度 。 现 代 计 算 
机 大 多 以 字 节 编 址 ,因此 ,在 计算 下 条 指令 的 地 址 时 ,只 要 将 PC 中 的 当前 指令 地 址 加 上 指 
令 的 字 节 数 就 行 了 。 例 如 ,MIPS 处 理 器 的 指令 字 都 是 32 位 ,因此 每 条 MIPS 指令 占 4 个 内 
存单 元 。 只 要 将 PC 的 值 加 4 就 可 以 得 到 下 条 指令 的 地 址 。 

10. 变 长 指令 字 格 式 的 处 理 器 中 ,如 何 读 取 指 令 ? 

答 : 变 长 指令 字 格 式 是 一 种 不 规整 型 指令 集 格式 ,指令 有 长 有 短 ,每 条 指令 所 包含 的 字 
节 个 数 不 同 。 因 此 ,在 取 当 前 指令 时 ,可 以 每 次 按 最 长 的 指令 长 度 来 取 。 例 如 ,如 果 最 长 指 
令 长 度 为 6, 则 每 次 取 6 个 字 节 ,然后 根据 指令 中 特定 位 的 规定 ,对 指令 中 的 各 字段 进行 划 
分 ,确定 指令 包含 的 操作 码 字 段 .寄存 器 编码 字段 .立即 数字 段 .直接 地 址 字段 或 转移 目标 地 
址 字段 等 。 因 为 总 是 按 最 长 指令 字 读 取 , 所 以 每 条 指令 总 是 包含 在 读 出 的 若干 字 节 中 。 

11. 变 长 指令 字 格 式 的 处 理 器 中 ,下 一 条 指令 地 址 如 何 计算 ? 

答 : 变 长 指令 字 格 式 是 一 种 不 规整 型 指令 集 格式 ,指令 有 长 有 短 , 每 条 指令 所 含 的 字 节 
数 不 同 ,因此 ,在 计算 下 条 指令 的 地 址 时 ,应 将 当前 指令 地 址 (PC 的 内 容 ) 加 上 当前 指令 的 
字 节 数 。 例 如 ,x86 处 理 器 的 指令 字 是 变 长 的 ,每 条 指令 从 一 个 字 节 到 多 个 字 节 不 等 。 因 
此 ,下 条 指令 地 址 通过 一 个 专门 的 PC 增 量 器 来 进行 计算 ,这 个 PC 增 量 器 能 根据 指令 中 相 
关 字段 的 值 ,确定 PC 应 该 加 几 。 

12. 从 处 理 器 设计 的 角度 ,你 认为 定 长 指令 字 好 还 是 变 长 指令 字 好 ? 

答 : 从 处 理 器 设计 的 角度 来 看 , 定 长 指令 字 格 式 比 变 长 指令 字 格 式 要 好 。 特 别 是 在 取 
指令 操作 和 计算 下 条 指令 地 址 方面 , 定 长 指令 字 可 以 大 大 简化 处 理 器 中 取 指 令 部 件 的 设计 。 

13. CPU 的 主 频 越 高 ,运算 速度 就 越 快 吗 ? 

答 : CPU 中 的 执行 部 件 (定点 运算 部 件 , 浮 点 运算 部 件 ) 的 每 一 步 动作 都 要 有 相应 的 控 
制 信号 进行 控制 ,这 些 控制 信号 何 时 发 出 ,作用 时 间 多 长 ,都 要 有 相应 的 时 钟 定时 信号 进行 
同步 ,CPU 的 主 频 就 是 同步 时 钟 信号 的 频率 。 

直观 上 来 看 , 主 频 越 高 ,每 一 步 的 动作 就 越 快 ,CPU 的 运算 速度 也 就 越 快 。 例 如 ,车 两 
台 机 器 的 CPI( 假 定 CPI 二 2) 和 ISA 都 一 样 , 则 主 频 为 500MHz 的 机 器 在 一 秒 钟 内 执行 
10 亿 条 指令 ,而 主 频 为 1GHz 的 机 器 在 一 秒 钟 内 执行 20 亿 条 指令 。 显 然 , 主 频 越 高 ,指令 
执行 速度 越 快 。 

主 频 是 反映 CPU 性 能 的 重要 指标 ,但 是 , 它 只 是 反映 了 一 个 侧面 ,不 是 绝对 的 。 对 于 
具有 不 同 ISA 和 不 同 CPI 的 两 台 计 算 机 ,就 不 能 简单 地 根据 主 频 来 衡量 运算 速度 。 例 如 ， 


t 





史 风 处 理 器 


对 于 非 流水 线 处理 器 ,如 果 将 一 条 指令 所 包含 的 操作 步骤 分 得 很 多 ,使 每 一 步 操 作 所 用 时 间 
很 短 ,定时 用 的 时 钟 周期 就 很 短 , 因 而 主 频 就 高 。 但 是 ,此 时 CPI 变 大 了 ,使 得 执行 一 条 指 
令 所 用 的 时 间 并 没有 缩短 。 

14. CPU 中 控制 器 的 功能 是 什么 ? 

答 : CPU 中 控制 器 主要 用 来 产生 各 条 指令 执行 所 需 的 控制 信号 。 有 两 大 类 控制 信号 ， 
CPU 内 部 控制 信号 和 发 送 到 系统 总 线 上 的 控制 信号 。 

15. 数据 通路 的 功能 是 什么 ? 

答 : CPU 的 基本 功能 就 是 执行 指令 ,指令 的 执行 过 程 就 是 数据 在 数据 通路 中 流动 的 过 
程 。 数 据 在 流动 过 程 中 ,要 经 过 一 些 执行 部 件 进行 相应 的 处 理 , 处 理 后 的 数据 要 送 到 存储 部 
件 保 在。 所 以 , 简 而 言 之 ,数据 通路 的 功能 就 是 通过 对 数据 进行 处 理 .存储 和 传输 来 完成 指 
令 的 执行 。 

16. 数据 通路 是 如 何 进行 数据 处 理 ,数据 传送 数据 存储 的 ? 

答 : 数据 通路 中 的 功能 部 件 包 括 两 种 不 同 的 逻辑 单元 : 进行 数据 处 理 的 组 合 逻 辑 单元 
( 称 为 操作 元 件 ) 和 进行 数据 存储 的 时 序 迎 辑 单元 ( 称 为 状态 单元 )。 组 合 泌 辑 单元 的 输出 只 
取决 于 当前 的 输入 ,也 就 是 说 ,输入 一 旦 改变 ,在 一 定 的 线路 延迟 后 ,输出 就 跟着 变化 ,因而 
它 只 能 完成 一 定 的 数据 处 理 功能 ,不 能 存储 数据 ,只 有 将 处 理 后 的 新 数据 送 到 一 个 状态 单元 
才能 保存 下 来 。 所 以 ,所 有 的 数据 处 理 单元 都 必须 将 处 理 后 的 输出 结果 写 到 状态 单元 中 ,而 
在 处 理 前 又 必须 从 状态 单元 接受 输入 。 因 此 ,数据 流动 的 起 点 是 状态 单元 ,经 过 一 些 组 合 罗 
辑 部 件 , 最 终 又 流 到 状态 单元 保存 。 功 能 部 件 之 间 的 输入 输出 信息 通过 连 线 进行 传送 。 

17. 数据 通路 中 流动 的 信息 有 哪些 ? 

答 : 指令 的 执行 过 程 就 是 数据 通路 中 信息 的 流动 过 程 。 因 此 要 理解 数据 通路 中 流动 的 
信息 类 型 ,必须 先 考察 指令 的 执行 过 程 。 因 为 每 条 指令 的 功能 不 同 , 所 以 其 执行 过 程 也 不 一 
样 。 但 总 体 来 说 ,指令 执行 过 程 中 涉及 的 基本 操作 包括 : 取 指 令 并 送 指令 寄存 器 ,计算 下 一 
条 指令 地 址 ,下 条 指令 地 址 送 PC , 读 取 寄 存 器 中 的 数据 到 ALU 输入 端 ,指令 中 的 立即 数 送 
扩展 器 或 ALU 输入 端 ,在 ALU 中 进行 运算 (包括 计算 内 存单 元 地 址 ) , 读 取 内 存 中 的 数据 
到 寄存 器 ,将 寄存 器 中 的 数据 写 到 内 存 ,ALU 输出 的 数据 写 到 寄存 器 等 。 因 此 ,在 数据 通路 
中 流动 的 信息 有 PC 的 值 .指令 、 指 令 中 的 立即 数 、 指 令 中 的 寄存 器 编号 .寄存 器 中 的 操作 
数 .ALU 运算 的 结果 .内 存单 元 中 的 操作 数 等 。 

18. 控制 信号 是 如 何 控制 数据 的 流动 的 ? 

答 : 指令 的 执行 过 程 就 是 数据 通路 中 信息 的 流动 过 程 。 数 据 通路 中 信息 的 流动 受 控制 
信号 的 控制 。 当 前 指令 被 取 到 指令 寄存 器 IR 后 ,指令 的 操作 码 部 分 被 送 到 指令 译 码 器 进 
行 译 码 ,指令 译 码 输出 信号 和 其 他 信号 一 起 组 合 后 生成 控制 信号 。 所 以 不 同 的 指令 得 到 不 
同 的 控制 信号 ,以 规定 数据 通路 完成 不 同 的 信息 流动 过 程 。 在 数据 通路 中 ,各 个 功能 部 件 中 
都 有 一 些 控制 点 ,这 些 控制 点 接收 不 同 的 控制 信号 ,就 使 得 功能 部 件 完成 不 同 的 操作 。 例 
如 ,ALU 的 操作 控制 点 接收 Add、Sub、And、Or 等 不 同 的 操作 信号 ,控制 ALU 完成 加 \ 减 、 
与 或 等 不 同 的 操作 。Load/Store 指令 译 码 后 把 *Add” 信 号 送 到 ALU 控制 点 ,控制 ALU 
进行 加 法 运算 来 计算 内 存单 元 的 地 址 。 再 例如 : 有 些 状态 单元 的 写 人 操作 由 一 个 “ 写 控制 
信号 ?来 控制 ,如 果 某 条 指令 不 需要 把 信息 写 人 寄存 器 或 内 存单 元 ,那么 ,这 条 指令 对 应 的 译 
码 信号 就 使 这 个 “ 写 控制 信号 ?无 效 , 从 而 控制 不 写 信 任何 信息 。 





第 
5 
章 





计算 机 组 成 与 系统 结 药 习题 解答 和 我 学 指 时 (第 2 版 ) 





19. 如 何 保证 一 条 指令 执行 过 程 中 的 操作 按 序 执行 ? 

答 : 对 于 每 条 指令 来 说 ,其 执行 过 程 应 该 是 有 序 的 。 例 如 ,对 于 运算 类 指令 ,其 操作 数 
一 定 要 先 取出 来 才能 进行 运算 ,运算 结果 一 定 是 在 最 后 才能 写 到 目的 寄存 器 。 对 于 Load/ 
Store 型 指令 一 定 是 先 取出 源 寄 存 器 的 值 , 并 先 对 立即 数 进行 符号 扩展 ,然后 才能 把 它们 送 
到 ALU 相 加 ,计算 出 内 存单 元 的 地 址 ,随后 再 访问 内 存单 元 取 数 或 存 数 。 因 而 必须 有 一 个 
机 制 来 控制 一 条 指令 的 有 序 执行 ,那么 ,如 何 控制 呢 ? 主要 是 通过 将 指令 执行 的 每 一 步 按 序 
送 到 相应 的 组 合 巡 辑 处 理 部 件 和 存储 信息 的 状态 元 件 。 在 每 个 时 钟 周期 中 ,组 合 逻辑 部 件 
在 相应 的 控制 信号 的 控制 下 进行 数据 处 理 ,数据 传送 ,而 在 时 钟 有 效 信号 到 达 时 状态 单元 保 
存 中 间 结 果 。 这 样 ,经 过 若干 个 时 钟 周 期 ,一 条 指令 就 在 数据 通路 中 执行 完成 了 。 

20. 多 路 选择 器 的 作用 与 工作 原理 是 什么 ? 

答 : 多 路 选择 器 也 称 数据 选择 器 或 多 路 复 用 器 。 它 的 作用 就 是 在 多 个 输入 中 选择 其 中 
的 一 个 作为 输出 。 因 此 , 它 有 多 个 输入 端 .一 个 输出 端 和 一 个 控制 端 。 控 制 端的 控制 信号 位 
数 由 输入 端的 个 数 确定 ,2 选 1 时 ,控制 信号 有 1 位 ,根据 控制 信号 为 0 还 是 1 ,决定 输入 端 1 
还 是 输入 端 2 作为 输出 。3 选 1 或 4 选 1 时 ,控制 信号 有 两 位 ,根据 控制 信号 为 00.01、10 还 
是 11, 决 定 输入 端 1、 输 入 端 2、. 输 入 端 3 或 输入 端 4 作为 输出 。 

21. 加 法 器 (adder) 和 ALU 的 差别 是 什么 ? 

答 : 加 法 器 只 能 实现 两 个 输入 的 相 加 运算 ,而 ALU 可 以 实现 多 种 算术 敢 辑 运算 。 可 以 
用 门 电路 直接 实现 加 法 器 ,也 可 以 通过 对 ALU 的 操作 控制 端 固定 设置 为 “加 ”操作 来 实现 
加 法 器 。 在 数据 通路 中 有 些 地 方 只 需 做 加 法 运算 ,如 指令 地 址 计算 时 ,这 时 就 不 需要 用 
ALU, 只 要 用 一 个 加 法 器 即 可 。 

22. 指令 存储 器 和 数据 存储 器 的 差别 是 什么 ? 

答 : 指令 存储 器 和 数据 存储 器 的 功能 不 一 样 ,指令 存储 器 专门 用 来 存放 指令 ,而 数据 存 
储 器 专门 存放 数据 。 所 以 ,从 指令 执行 过 程 来 看 ,指令 存储 器 只 在 取 每 条 指令 时 执行 读 操 
作 , 每 个 指令 周期 都 一 样 ,而 数据 存储 器 只 有 在 执行 访 存 指令 时 才 被 访问 ,而 且 不 仅 可 能 有 
读 操作 ,也 可 能 有 写 操作 。 指 令 存储 器 的 读 地 址 由 PC 提供 ,而 数据 存储 器 的 读 地 址 和 写 地 
址 都 由 ALU 的 输出 端 提 供 , 因 为 数据 的 地 址 需要 通过 基 址 和 偏 移 量 在 ALU 中 相 加 得 到 。 
数据 存储 器 的 写 操作 需要 一 个 写 控制 信号 ( 即 写 使 能 信号 Write Enable) 进 行 控制 。 现 代 计 
算 机 中 ,CPU 内 的 一 级 cache 采用 数据 cache 和 代码 cache 分 离 的 方式 ,所 以 指令 存储 器 实 
际 上 是 处 理 器 中 的 代码 cache, 数 据 存储 器 实际 上 是 处 理 器 中 的 数据 cache。 

23. 如 何 确定 CPU 的 时 钟 周 期 ? 

答 : 在 一 个 边沿 触发 的 同步 数字 系统 中 ,一 个 状态 量 的 改变 总 是 在 时 钟 的 上 升 沿 或 下 
降 沿 发 生 ,我 们 称 上 升 沿 或 下 降 沿 的 到 来 为 时 钟 有 效 信号 到 达 。 一 个 状态 量 的 改变 必须 满 
足以 下 三 个 条 件 : (1) 新 写 人 的 数据 已 经 生成 并 稳定 在 状态 单元 的 输入 端 ; (2) 写 使 能 信号 
有 效 ，(3) 时 钟 有 效 信号 到 达 。 在 前 面 两 个 条 件 满足 的 情况 下 ,一 旦 时 钟 有 效 信号 到 达 , 则 
输入 数据 开始 写 入 状态 单元 ,经 过 一 定 的 延迟 后 ,状态 单元 的 输出 变 为 新 输入 的 数据 。 所 以 
要 能 使 电路 正确 工作 ,必须 使 新 写 人 的 数据 在 时 钟 有 效 信号 到 达 前 稳定 在 输入 端 。 也 即 ， 
时 钟 周期 必须 足够 长 ,使 得 在 状态 单元 之 间 进 行 数据 处 理 的 组 合 人 逻辑 电路 有 足够 的 时 间 来 
得 到 新 的 数据 。 因 此 ,应 将 所 有 相 邻 状态 单元 之 间 的 组 合 逻辑 电路 中 最 长 的 延 时 作为 基准 
来 确定 时 钟 周 期 ,以 保证 在 一 个 时 钟 周 期 内 所 有 的 组 合 电路 能 完成 必要 的 数据 处 理工 作 ,在 
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下 个 时 钟 到 来 后 ,数据 能 存储 在 状态 单元 中 。 

24. 如 何 确定 单 周 期 数据 通路 的 时 钟 周期 长 度 ? 

答 : 单 周期 数据 通路 指 每 条 指令 的 执行 在 一 个 时 钟 周期 内 完成 , 即 CPI 二 1。 因 此 ,在 
单 周 期 数据 通路 中 ,每 当 一 个 时 钟 有 效 边沿 到 来 时 ,开始 一 条 指令 的 执行 ,所 有 指令 都 要 求 
在 一 个 时 钟 周期 内 能 够 完成 ,下 个 时 钟 有 效 边沿 到 来 时 ,上 个 时 钟 周期 完成 的 指令 的 结果 被 
写 到 目的 寄存 器 或 存储 器 ,同时 上 个 时 钟 周期 内 计算 出 的 指令 的 地 址 被 打 入 PC, 一 段 时 间 
(clock-to-Q) 延 迟 后 ,PC 的 值 被 送 到 指令 存储 器 ,开始 取 下 条 指令 并 执行 。 所 以 , 单 周期 数 
据 通 路 的 时 钟 周期 的 长 度 应 该 以 最 复杂 的 指令 所 需 的 执行 时 间 为 准 来 确定 ,以 保证 所 有 指 
令 都 能 在 一 个 时 钟 周期 内 完成 。 

因为 单 周期 数据 通路 中 指令 的 执行 结果 总 是 在 下 个 时 钟 到 来 时 才 被 写 到 状态 单元 ,所 
以 ,整个 指令 执行 过 程 都 是 在 组 合 逻 辑 电路 中 进行 的 ,没有 中 间 结 果 的 保存 。 以 MIPS 中 复 
杂 的 lw 指令 为 例 , 一 个 时 钟 的 宽度 应 该 包括 : PC 的 锁 存 时 间 (PC's clock-to-Q)、 取 指 时 间 
(instruction memory access time) ,寄存 器 堆 存 取 时 间 (register file access time) ,ALU 运算 
延 时 (ALU delay) ,数据 存储 器 存 取 时 间 (data memory access time) 寄存器 堆 建 立时 间 
(register file setup time) 和 时 钟 偏 移 (clock skew) 。 

25. 单 周期 数据 通路 中 ,控制 信号 何 时 发 出 ? 

答 : 单 周期 数据 通路 中 ,每 条 指令 在 一 个 周期 内 完成 ,所 有 控制 信号 同时 产生 ,在 指令 
取出 后 ,指令 操作 码 字 段 及 相关 的 控制 字段 送 到 控制 逻辑 ,由 控制 逻辑 统一 得 到 各 个 控制 信 
号 ,每 个 控制 信号 被 送 到 相应 的 控制 点 ,一 直 作用 在 数据 通路 中 ,直到 下 一 条 指令 执行 过 程 
中 产生 新 的 控制 信号 。 例 如 ,假定 作用 在 ALU 上 的 控制 信号 ALUCtrl 为 001 时 ,ALU 做 
加 法 ;为 010 时 ,做 减法 ;为 011 时 做 与 操作 …… 那 么 ,执行 加 法 指令 Add 时 ,操作 信号 
ALUCtrl 一 直 以 001 作用 在 ALU 的 操作 控制 端 上 , 若 下 一 条 为 减法 指令 Sub, 则 该 指令 被 
取出 译 码 后 从 控制 逻辑 送出 的 ALUCtrl 信号 的 取 值 就 变 为 010 ,在 执行 减法 过 程 中 ,操作 
信号 ALUCtrl 一 直 以 010 作用 在 ALU 的 操作 控制 端 上 。 

26. 如 何 确定 多 周期 数据 通路 的 时 钟 周期 长 度 ? 

答 : 多 周期 数据 通路 通过 把 指令 的 执行 分 成 多 个 阶段 来 实现 , 即 CPI 宇 1。 规 定 每 个 阶 
段 在 一 个 时 钟 周期 内 完成 ,时 钟 周期 以 最 复杂 的 阶段 所 花 时 间 为 准 ,阶段 的 划分 原则 是 : 将 
一 条 指令 的 执行 过 程 尽量 分 成 大 致 相等 的 若干 阶段 。 这 样 ,可 以 使 得 时 钟 周期 尽量 短 。 

在 多 周期 数据 通路 中 ,一 条 指令 的 执行 由 多 个 时 钟 周期 来 控制 。 不 同 的 指令 所 含 的 时 
钟 周期 数 不 同 。 复 杂 指令 所 含 的 时 钟 周期 数 多 于 简单 指令 的 时 钟 周期 数 。 

27. 多 周期 数据 通路 中 ,控制 信号 何 时 发 出 ? 

答 : 多 周期 数据 通路 中 ,每 条 指令 的 执行 分 成 若干 个 阶段 完成 ,每 来 一 个 时 钟 ,就 进入 
到 下 一 个 阶段 。 因 为 在 数据 通路 中 每 个 不 同 的 阶段 将 完成 不 同 的 功能 ,所 以 控制 信号 在 每 
个 时 钟 到 来 的 时 候 改变 其 值 。 因 此 ,和 单 周期 数据 通路 不 同 ,同一 个 控制 信号 的 取 值 在 一 个 
指令 周期 中 可 能 改变 多 次 。 

28. 为 什么 很 少 有 机 器 采用 单 周 期 数据 通路 ? 

答 : 因为 单 周期 数据 通路 以 最 复杂 指令 所 需 时 间 为 准 来 设计 时 钟 周期 ,每 条 指令 的 执 
行 时 间 都 一 样 ,是 极 大 的 浪费 。 
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29. 单 周期 处 理 器 的 基本 设计 步骤 是 什么 ? 

答 : 处 理 器 的 设计 是 相当 复杂 的 过 程 ,设计 者 必须 在 集成 电路 技术 ,指令 集 体系 结构 、 
计算 机 性 能 评价 等 方面 具有 丰富 的 知识 和 相当 的 经 验 。 但 不 管 有 多 复杂 ,其 基本 步骤 都 可 
以 归纳 为 以 下 几 步 : @ 分 析 每 条 指令 的 功能 ,并 用 某 种 形式 化 方法 (如 RTL) 来 表示 ; @ 根 
据 指令 的 功能 给 出 所 需 的 元 件 ,并 考虑 如 何 互 连 ,这 个 各 部 件 互 连 后 的 电路 就 是 数据 通路 ; 
@ 确 定 每 个 元 件 所 需 的 控制 信号 的 取 值 ; @ 汇 总 所 有 指令 所 涉及 的 控制 信号 ,生成 一 张 反 
映 指令 与 控制 信号 之 间 关 系 的 表 ; @@ 根 据 关系 表 得 到 每 个 控制 信号 的 逮 辑 表达 式 , 据 此 设 
计 控 制 器 电路 。 

30. 控制 器 有 哪 两 种 实现 方式 ”各 有 何 优 缺 点 ? 

答 : 有 两 种 实现 方式 : 四 用 组 合 逻辑 电路 和 状态 寄存 器 实现 硬 连 线路 控制 器 ; @ 用 微 
程序 设计 方式 实现 微 程序 控制 器 。 硬 连 线路 控制 器 的 优点 是 速度 快 ,适合 于 实现 简单 或 规 
整 的 指令 系统 。 但 是 , 它 是 一 个 多 输入 /多 输出 的 巨大 的 逻辑 网 络 。 对 于 复杂 的 指令 系统 来 
说 ,其 结构 庞杂 ,实现 困难 ,修改 ,维护 不 易 ,灵活 性 差 。 微 程序 控制 器 的 特点 是 具有 规整 性 、 
可 维 性 和 灵活 性 ,但 速度 慢 。 为 了 结合 两 种 方式 的 优点 ,很 多 处 理 器 采用 两 者 结合 的 方式 来 
实现 。 例 如 ,486 之 后 的 80x86 系统 都 综合 使 用 硬 布线 来 处 理 简单 指令 ,用 微 程序 方式 ( 微 
码 ) 实 现 复杂 指令 。 

31. 如 何 实现 硬 连 线路 控制 器 ? 

答 : 用 组 合 逻 辑 电路 和 状态 寄存 器 实现 硬 连 线路 控制 器 ,也 称 为 基于 有 限 状态 机 方式 。 
其 基本 思想 是 : 将 所 有 指令 执行 的 每 个 阶段 (一 个 时 钟 周期 内 ) 所 包含 的 控制 信号 的 取 值 作 
为 一 个 状态 ,每 来 一 个 时 钟 , 则 进入 下 一 个 阶段 对 应 的 状态 ,每 个 状态 对 应 一 组 控制 信号 。 

这 样 ,每 条 指令 的 执行 过 程 就 由 有 限 状 态 机 的 每 个 状态 中 包含 的 控制 信号 来 控制 。 因 
此 ,控制 器 的 设计 也 就 是 考虑 怎样 使 得 控制 器 每 来 一 个 时 钟 就 从 当前 状态 进入 到 下 一 状态 ， 
状态 的 改变 又 使 得 控制 信号 的 值 发 生 改 变 。 有 限 状 态 机 控制 器 通常 由 一 个 组 合 逻辑 电路 模 
块 和 一 个 状态 寄存 器 组 成 。 状 态 寄存 器 如 何 变化 是 由 当前 状态 和 当前 指令 决定 的 ,而 组 合 
罗 辑 控制 模块 可 以 由 一 个 ROM 或 一 个 PLA 实现 。 

32， 微 程序 控制 器 设计 的 基本 思想 是 什么 ? 

答 : 仿照 程序 设计 的 方法 编制 每 个 机 器 指令 对 应 的 微 程序 ,每 个 征程 序 由 若干 条 微 指 
令 构 成 ,各 微 指令 包含 若干 条 微 命令 。 所 有 指令 对 应 的 微 程序 放 在 只 读 存储 器 中 。 当 执行 
到 某 条 指令 时 ,取出 对 应 的 微 程序 中 的 各 条 微 指令 , 译 码 产 生 对 应 的 微 命令 (控制 信号 ), 送 
到 机 器 相应 的 地 方 ,控制 其 动作 。 

33. 有 哪 几 种 微 指 令 格式 设计 风格 ? 

微 指令 格式 设计 有 两 种 风格 。 一 种 是 水 平 型 微 指令 ,面向 内 部 控制 逻辑 的 描述 ,包括 不 
译 法 (直接 控制 法 ) .字段 直接 编码 ( 译 ) 法 等 。 字 段 直接 编码 法 的 基本 思想 是 ,把 能 同时 执行 
的 微 命令 尽量 多 地 安排 在 一 条 微 指令 中 。 通 常 把 能 同时 执行 的 微 命令 称 为 相 容 微 命令 。 这 
种 微 指令 格式 的 微 程序 短 , 微 命令 并 行 性 高 ,适合 于 较 高 速度 的 场合 。 但 缺点 是 微 指令 长 ， 
编码 空间 利用 率 较 低 , 并 且 编 制 较为 困难 。 另 一 种 是 垂直 型 微 指令 ,面向 算法 描述 ,也 称 为 
最 小 (或 最 短 、 垂 直 ) 编 码 ( 译 ) 法 ,其 基本 思想 是 ,借鉴 指令 编码 的 思想 ,使 得 一 条 微 指令 只 控 
制 一 两 个 微 命令 。 这 种 风格 的 微 指 令 短 ,编码 效率 高 ,格式 与 机 器 指令 类 似 , 故 编制 容易 。 
其 缺点 是 微 程序 长 ,一 条 微 指令 只 能 控制 一 两 个 微 命令 ,无 并 行 ,因而 速度 慢 。 
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34. 如 何 找到 指令 对 应 的 第 一 条 微 指令 ? 

答 : 控 存 中 存放 着 所 有 指令 对 应 的 微 程序 ,因而 控 存 中 有 成 百 上 千 条 微 指令 。 每 一 条 
指令 执行 时 ,必须 找到 这 条 指令 对 应 微 程序 所 包含 的 微 指令 序列 中 的 第 一 条 微 指令 ,然后 按 
一 定 的 顺序 执行 这 个 微 指 令 序列 ,每 个 时 钟 执行 一 条 微 指令 。 那 么 ,如 何 找到 对 应 的 第 一 条 
微 指令 呢 ? 通常 一 条 指令 的 执行 总 是 从 取 指 令 开始 ,在 取出 指令 之 后 进行 指令 译 码 , 可 以 用 
ROM 或 PLA 来 实现 一 个 调度 表 , 其 人 口 为 指令 译 码 结果 ,而 输出 为 每 条 指令 对 应 的 微 指 
令 序 列 的 首 条 微 指令 在 控 存 中 的 地 址 。 根 据 这 个 地 址 到 控 存 中 取出 第 一 条 微 指令 执行 
即 可 。 

35. 如 何 控制 微 指令 的 执行 顺序 ? 

在 找到 指令 对 应 的 首 条 微 指令 后 ,就 可 以 按照 一 定 的 顺序 来 执行 指令 对 应 的 微 指令 序 
列 。 那么, 如何 控 制 处 理 器 按照 正确 的 顺序 执行 微 指令 序列 呢 ? 这 就 是 微 指令 定 序 器 的 实 
现 问 题 。 可 以 有 以 下 两 种 方式 来 确定 下 条 微 指令 地 址 ; 增 量 法 (计数 器 法 ) 和 断定 法 (下 址 
字段 法 )。 

增 量 法 (计数 器 法 ) 的 基本 思想 是 ,借鉴 指令 定 序 器 的 实现 思路 ,用 一 个 专门 的 计数 器 
(通常 称 为 微 程序 计数 器 wPC, 对 应 于 程序 计数 器 PC) 来 指定 下 一 条 需 执 行 的 微 指令 地 址 。 
在 微 指令 序列 的 执行 过 程 中 ,大 部 分 情况 下 每 条 微 指 令 的 后 续 微 指令 都 是 确定 的 , 即 总 是 顺 
序 地 执行 一 条 确定 的 后 续 微 指令 ,这 样 ,只 要 在 编制 微 程序 时 就 把 后 续 微 指令 存放 在 控 存 的 
后 续 相 邻 单元 中 ,就 可 以 按照 计数 器 指定 的 顺序 执行 ,每 执行 完 一 条 微 指令 ,计数 器 PC 就 
顺序 增 量 一 次 ;对 于 少数 几 个 需要 根据 不 同 的 指令 操作 码 或 操作 数 的 不 同 寻 址 方式 进行 选 
择 的 情况 ,可 以 用 一 个 调度 表 或 在 微 程序 中 插入 转移 微 指令 (分 支 微 指令 ) 来 实现 。 

断定 法 (下 址 字段 法 ) 的 基本 思想 是 ,在 每 条 微 指令 中 增加 一 个 字段 ,用 以 指出 下 一 条 要 
执行 的 微 指令 的 地 址 ,在 遇 到 多 个 后 续 微 指令 ( 即 有 分 支 ) 的 情况 时 ,采用 一 个 调度 表 或 相应 
的 地 址 修改 逻辑 来 实现 多 分 支 。 

36. 中 断 (interrupt) 和 异常 (exception) 的 区 别 是 什么 ? 

答 : 有 关中 断 和 蜡 常 的 概念 ,很 多 教科 书 或 资料 中 都 有 不 同 的 定义 。 有 些 作 者 或 体系 
结构 并 不 区 分 它们 ,把 它们 统称 为 中 断 , 例 如 ,PowerPC 体系 结构 用 异常 来 指 代 意外 事件 ， 
用 中 断 表示 指令 执行 时 控制 流 的 改变 。 在 MIPS 系统 和 一 些 经 典 的 国外 教科 书 中 ,异常 ” 
和 “中 断 ” 的 概念 是 有 区 别 的 ,根据 来 自 处 理 器 内 部 还 是 外 部 来 区 分 。 把 执行 指令 过 程 中 由 
指令 本 身 引 起 的 来 自 处 理 器 内 部 的 特殊 事件 称 为 “异常 ”, 把 来 自 处 理 器 外 部 的 由 外 部 设备 
通过 “中 断 请 求 ” 信 号 向 CPU 申请 的 事件 称 为 “中 断 ”。 

37. 除了 有 外 设 或 他 机 向 CPU 发 中 断 请 求 要 求 中 断 CPU 外 ,还 有 哪些 情况 会 中 断 
CPU 正在 运行 的 程序 , 转 到 其 他 相应 的 处 理 过 程 去 执行 ? 

答 : 以 下 4 种 情况 发 生 时 ,会 中 断 CPU 正在 运行 的 程序 , 转 到 其 他 相应 的 处 理 过 程 去 
执行 。 

(1) 在 程序 执行 过 程 中 , 若 外 设 完 成 任务 或 发 生 某 些 特殊 事件 (如 打印 机 缺 纸 .定时 采 
样 计数 时 间 到 ,键盘 缓冲 满 等 ) ,会 向 CPU 发 中 断 请 求 ,要 求 CPU 对 这 些 情况 进行 处 理 。 
处 理 完 后 , 回 到 原 被 中 断 程序 的 断 点 处 继续 执行 。 这 种 情况 称 为 1O 中 断 或 外 部 中 断 , 特 
指 由 CPU 外 部 的 设备 向 CPU 发 的 中 断 请 求 。 

(2) 在 执行 某 条 指令 时 ,可 能 发 生 一 些 特殊 的 “异常 事件 ”, 如 缺 页 溢出 除数 为 0、 非 法 
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操作 码 等 ,使 当前 指令 无 法 继续 执行 。 此 时 也 要 求 CPU 中 止 原 程序 的 执行 , 转 到 处 理 相应 
情况 的 程序 去 执行 ,处 理 完 后 ,再 回 到 发 生 异常 的 指令 继续 执行 。 这 种 情况 称 为 失效 或 故障 
(fault) ,是 由 正在 执行 的 指令 产生 的 。 

(3) 还 有 一 类 是 人 为 设 定 的 事件 ,在 程序 中 事先 设 定 一 条 特殊 的 指令 ,通过 执行 这 条 特 
殊 指令 ,自动 中 止 正 在 执行 的 原 程序 , 转 到 一 个 特定 的 内 核 管理 程序 去 执行 ,执行 完 后 , 回 到 
那 条 特殊 指令 后 面 的 一 条 指令 开始 执行 ,这 被 称 为 自愿 中 断 或 自 陷 (trap)。 这 些 特殊 指令 
称 为 “ 访 管 指令 ?( 访 问 管理 程序 ) 或 “ 自 陷 指 令 ”( 自 动 掉 和 人 陷阱 ), 如 80x86 中 的 指令 
“NT 

(4) 还 有 一 种 情况 , 既 不 是 外 部 设备 发 出 ,也 不 是 指令 本 身 产生 ,是 在 执行 指令 过 程 中 
发 生 了 硬件 故障 ,如 电源 掉 电 、 线 路 故障 等 ,使 CPU 无 法 继续 执行 。 这 类 异常 是 随机 发 生 
的 ,对 引起 异常 的 指令 的 确切 位 置 无 法 确定 ,出 现 这 类 严重 错误 时 , 原 程序 无 法 继续 执行 ,只 
好 终止 ,而 由 中 断 服务 程序 重新 启动 操作 系统 。 因 此 这 种 情况 被 称 为 终止 (abort) 。 

综 上 所 述 ,上 述 4 种 中 断 源 (异常 事件 ) 分 为 两 大 类 。 第 一 种 称 为 外 部 中 断 ( 有 时 简称 为 
中 断 ,interrupt) ,后 面 3 种 称 为 内 部 异常 (也 称 为 内 部 中 断 ,程序 性 中 断 或 软 中 断 ), 包 括 故 
障 (faultb) 、 自 陷 (trap) 和 终止 (abort)3 类 。 内 部 异常 是 在 执行 特定 的 指令 时 发 生 的 ,不 需要 
通过 外 部 中 断 请 求 线 进 行 中 断 请 求 。 

38. 为 什么 在 设计 处 理 器 时 必须 考虑 异常 和 中 断 的 情况 ? 

答 : 异常 和 中 断 是 CPU 在 执行 指令 过 程 中 ,指令 自身 或 外 部 设备 发 生 的 一 些 特殊 事 
件 , 这 些 特殊 事件 使 得 当前 指令 不 能 继续 执行 下 去 ,或 者 ,需要 CPU 停 下 当前 程序 的 执行 ， 
去 处 理 外 部 中 断 事件 。 因 此 ,在 数据 通路 中 必须 考虑 相应 的 检测 线路 ,能 够 发 现 这 种 特殊 的 
异常 事件 ,并 且 还 要 考虑 相应 的 控制 转换 电路 ,能 够 完成 关中 断 、 保 护 断 点 和 转 中 断 处 理 程 
序 执行 等 功能 。 通 常 把 这 种 控制 转换 电路 的 执行 过 程 称 为 “中 断 隐 指 令 ” 的 执行 过 程 ,在 这 
个 执行 过 程 中 实现 了 对 “内 部 异常 ”或 “外 部 中 断 ” 的 响应 。 


5.5 单项 选择 题 
1. 机 器 主 频 的 倒数 (一 个 节拍 ) 等 于 ( ””)。 
A. CPU 时 钟 周 期 B. 主板 时 钟 周 期 
C. 指令 周期 D. 存储 周期 
2. CPU 中 控制 器 的 功能 是 (  )。 


A. 产生 时 序 信和 号 
B. 控制 从 主 存 取出 一 条 指令 
C. 完成 指令 操作 码 译 码 
D. 完成 指令 操作 码 译 码 ,并 产生 操作 控制 信号 
3. 汉 ，, 诺 依 曼 计算 机 中 指令 和 数据 均 以 二 进 制 形式 存放 在 存储 器 中 , CPU 依据 
( ，) 来 区 分 它们 。 
A. 指令 和 数据 的 表示 形式 不 同 B. 指令 和 数据 的 寻 址 方式 不 同 
C. 指令 和 数据 的 访问 时 点 不 同 D. 指令 和 数据 的 地 址 形式 不 同 
4. 下 列 寄存 器 中 ,对 汇编 语言 程序 员 不 透明 的 是 ( )。 


中 央 处 理 器 


A. 存储 器 地 址 寄存 器 (MAR) B. 程序 计数 器 (PC) 
C. 存储 器 数据 寄存 器 (MDR) D. 指令 寄存 器 (IR) 
5. 下 列 有 关 CPU 中 部 分 部 件 的 功能 的 描述 中 ,错误 的 是 (。”)。 
A. 控制 单元 用 于 对 指令 操作 码 译 码 并 生成 控制 信号 
B. PC 称 为 程序 计数 器 ,用 于 存放 将 要 执行 的 指令 的 地 址 
C. 通过 将 PC 按 当前 指令 长 度 增 量 , 可 实现 指令 的 按 序 执行 
D. IR 称 为 指令 寄存 器 ,用 来 存放 当前 指令 的 操作 码 
6. 执行 完 当前 指令 后 ,PC 中 存放 的 是 后 继 指令 的 地 址 ,因此 PC 的 位 数 和 (  ) 的 位 


数 相同 。 
A. 指令 寄存 器 IR B. 指令 译 码 器 ID 
C. 主 存 地址 寄存 器 MAR D. 程序 状态 字 寄 存 器 PSWR 
7. 通常 情况 下 ,下 列 ( ) 部 件 不 包含 在 中 央 处 理 器 (CPU) 芯 片 中 。 
A. ALU B. 控制 器 C. 通用 寄存 器 D. DRAM 


8. 下 列 有 关 程 序 计数 器 PC 的 叙述 中 ,错误 的 是 ( 。”)。 
A. 每 条 指令 执行 后 ,PC 的 值 都 会 被 改变 
B. 指令 顺序 执行 时 ,PC 的 值 总 是 自动 加 1 
C. 调用 指令 执行 后 ,PC 的 值 一 定 是 被 调用 过 程 的 入 口 地 址 
D. 无 条 件 转移 指令 执行 后 ,PC 的 值 一 定 是 转移 目标 地 址 
9. CPU 取出 一 条 指令 并 执行 所 用 的 时 间 被 称 为 ( Js 
A. 时 钟 周 期 B. CPU 周期 C. 机 器 周期 D. 指令 周期 
10. 下 列 有 关 指 令 周 期 的 叙述 中 ,错误 的 是 (  )。 
A. 指令 周期 的 第 一 个 阶段 一 定 是 取 指令 阶段 
B. 乘法 指令 和 加 法 指令 的 指令 周期 总 是 一 样 长 
C. 一 个 指令 周期 由 若干 个 机 器 周期 或 时 钟 周期 组 成 
D. 单 周期 CPU 中 的 指令 周期 就 是 一 个 时 钟 周期 
11. 下 列 有 关 CPU 时 钟 信号 的 叙述 中 ,错误 的 是 (  )。 
A. 处 理 器 总 是 每 来 一 个 时 钟 信 号 就 开始 执行 一 条 新 的 指令 
B. 边沿 触发 指 状态 单元 总 在 时 钟 上 升 沿 或 下 降 沿 开始 改变 状态 
C. 时 钟 周期 以 相 邻 状态 单元 之 间 最 长 组 全 逻辑 延迟 为 基准 确定 
D. 每 个 时 钟 周期 称 为 一 个 节拍 ,机 器 的 主 频 就 是 时 钟 周 期 的 倒数 
12. 下 列 有 关 数 据 通路 的 叙述 中 ,错误 的 是 (  )。 
A. 数据 通路 由 若干 操作 元 件 和 状态 元 件 连接 而 成 
B. 数据 通路 的 功能 由 控制 部 件 送出 的 控制 信号 决定 
C. ALU 属于 操作 元 件 , 用 于 执行 各 类 算术 和 逻辑 运算 
D. 通用 寄存 器 属于 状态 元 件 ,但 不 包含 在 数据 通路 中 
13. 下 列 有 关 取 指令 操作 部 件 的 叙述 中 ,错误 的 是 (。”)，。 
A. 取 指 令 操作 的 时 延 主要 由 存储 器 的 取 数 时 间 决 定 
B. 取 指令 操作 可 以 和 下 条 指令 地 址 的 计算 操作 同时 进行 
C. 单 周 期 数据 通路 中 需 用 一 个 指令 寄存 器 存放 取出 的 指令 
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D. PC 在 单 周 期 数据 通路 中 不 需要 “ 写 使 能 ”控制 信号 
14. 下 列 有 关 多 周期 数据 通路 和 单 周期 数据 通路 比较 的 叙述 中 ,错误 的 是 (。”)。 
A. 单 周 期 处 理 器 的 CPI 总 比 多 周期 处 理 器 的 CPI 大 
B. 单 周期 处 理 器 的 时 钟 周期 比 多 周期 处 理 器 的 时 钟 周期 长 
C. 在 一 条 指令 执行 过 程 中 , 单 周 期 处 理 器 中 的 每 个 控制 信号 取 值 一 直 不 变 , 而 多 
周期 处 理 器 中 的 控制 信号 可 能 会 发 生 改 变 
D. 在 一 条 指令 执行 过 程 中 , 单 周期 数据 通路 中 的 每 个 部 件 只 能 被 使 用 一 次 ,而 在 
多 周期 中 同一 个 部 件 可 使 用 多 次 
15. 下 面 是 有 关 MIPS 架构 的 R 型 指令 数据 通路 设计 的 叙述 : 
@ 在 RR 型 指令 数据 通路 中 ,一 定 有 一 个 具有 读 口 和 写 口 的 通用 寄存 器 组 
@ 在 RR 型 指令 数据 通路 中 ,一 定 有 一 个 ALU 用 于 对 寄存 器 读 出 数据 进行 运算 
@ 在 RR 型 指令 数据 通路 中 ,一 定 存 在 一 条 路 径 使 ALU 输出 被 送 到 某 个 寄存 器 
@ 执行 R 型 指令 时 ,通用 寄存 器 堆 的 “ 写 使 能 ”控制 信号 一 定 为 1 
以 上 叙述 中 ,正确 的 有 ( ”)。 
A. 0.O 和 9 B. OO 和 @ C. OO 和 @ D. 全 部 
16. 下 面 是 有 关 MIPS 架构 的 lw/sw 指令 数据 通路 设计 的 叙述 : 
@ 在 lw/sw 指令 数据 通路 中 ,一 定 有 一 个 符号 扩展 部 件 用 于 偏 移 量 的 扩展 
@ 在 lw/sw 指令 数据 通路 中 ,ALU 的 控制 信号 一 定 为 addu( 即 ALU 做 加 法 ) 
@ 寄存 器 堆 的 “ 写 使 能 ”信号 在 lw 指令 执行 时 为 1 ,在 sw 指令 执行 时 为 0 
@ 数据 存储 器 的 “ 写 使 能 ”信号 在 lw 指令 执行 时 为 0, 在 sw 指令 执行 时 为 1 
以 上 叙述 中 ,正确 的 有 (  ”)。 
A. OD.@ 和 ® B. DO 和 @ C. OO 和 @ D. 全 部 
17. 下 面 是 有 关 MIPS 架构 的 beq 指令 的 单 周期 数据 通路 设计 的 叙述 ， 
g@ 在 beq 指令 的 执行 过 程 中 ,ALU 的 两 个 输入 都 来 自 寄存 器 堆 
@ 在 beq 指令 数据 通路 中 ,ALU 的 控制 信号 一 定 为 subu( 即 ALU 做 减法 ) 
@ 在 beq 指令 数据 通路 中 ,一 定 有 一 个 加 法 器 用 于 计算 转移 目标 地 址 
@ 在 beq 指令 的 执行 过 程 中 ,数据 不 会 流 经 符号 扩展 部 件 
以 上 叙述 中 ,正确 的 有 ( ”)。 
A. OD.@ 和 ® B. OQ 和 @ C. @.O 和 @ D. 全 部 
18. 某 计算 机 指令 集中 包含 RR 型 运算 指令 、 取 数 指令 Load、 存 数 指令 Store、 分 支 指令 
Branch 和 跳 转 指令 Jump。 若 采用 单 周期 数据 通路 实现 该 指令 系统 ,各 主要 功能 部 件 的 操 
作 时 间 为 : 指令 存储 器 和 数据 存储 器 都 是 3ns; ALU 和 加 法 器 都 是 2ns; 寄 存 器 堆 的 读 和 写 
都 是 lns。 在 不 考虑 多 路 复 用 器 控制 单元 .PC 符号 扩展 单元 和 传输 线路 等 延迟 的 情况 下 ， 
该 计算 机 时 钟 周 期 至 少 为 (  )。 
A. 6ns B. 8ns C. 10ns D. 12ns 
19. 下 列 有 关 微 指令 格式 的 描述 中 ,错误 的 是 (。”)。 
A. 相对 于 直接 控制 法 (不 译 法 ) ,字段 直接 编码 法 的 控 存 利 用 率 更 高 
B. 相对 于 字段 直接 编码 法 ,直接 控制 法 (不 译 法 ) 的 执行 速度 更 快 
C. 相对 于 断定 法 (下 址 字段 法 ) ,采用 计数 器 法 的 微 指令 格式 更 短 


史 天 处理 器 


D. 相对 于 水 平 型 微 指令 ,一 条 垂直 型 微 指令 中 包含 的 微 命令 更 多 

20. 下 列 有 关 指 令 和 微 指令 之 间 关 系 的 描述 中 ,正确 的 是 (。”)。 

A. 一 条 指令 的 功能 通过 执行 一 条 微 指令 来 实现 
B. 一 条 指令 的 功能 通过 执行 一 个 微 程序 来 实现 
C. 一 条 微 指令 的 功能 通过 执行 一 条 指令 来 实现 
D. 一 条 微 指 令 的 功能 通过 执行 一 个 微 程序 来 实现 
21. 相对 于 微 程序 控制 器 , 硬 布线 控制 器 的 特点 是 ( 。”)。 
A. 指令 执行 速度 慢 , 指 令 功能 的 修改 和 扩展 容易 
B. 指令 执行 速度 慢 , 指 令 功 能 的 修改 和 扩展 难 
C. 指令 执行 速度 快 ,指令 功能 的 修改 和 扩展 容易 
D. 指令 执行 速度 快 ,指令 功能 的 修改 和 扩展 难 
22. 以 下 有 关 “ 自 陷 ”(trap) 异 常 的 叙述 中 ,错误 的 是 (。”)。 
A.“ 自 陷 " 是 人 为 预先 设 定 的 一 种 特定 处 理事 件 
B. 由 “ 访 管 指令 ”或 “ 自 陷 指 令 ” 的 执行 进入 “ 自 陷 ” 
C. 一 定 是 出 现 了 某 种 异常 情况 才 会 发 生 “ 自 陷 ” 
D.“ 自 陷 ” 发 生 后 CPU 将 进入 操作 系统 内 核 程序 执行 

【参考 答案 】 

BUA DBD BE WB mB te TD LB DB WB 

1 1 DD BC M.A WD 16 DBD WA le CC WD'20B 

21. DBD ‘22, C 

【部 分 题目 的 答案 解析 】 

4. 某 个 寄存 器 对 于 汇编 语言 程序 员 来 说 是 透明 的 ,含义 是 指 汇编 语言 程序 员 在 使 用 汇 
编 指令 编写 程序 时 ,无 法 感知 到 这 个 寄存 器 的 存在 ,显然 ,汇编 程序 员 无 须知 道 MAR、MDR 
和 IR 是 否 存在 ,更 无 须 了 解 这 些 寄 存 器 和 程序 是 什么 关系 ,但 是 ,汇编 程序 员 肯 定 知道 指 
令 会 如 何 改变 程序 计数 器 PC 的 内 容 ,可 以 使 用 转移 指令 来 改变 程序 计数 器 的 顺序 增 量 方 
式 ,因此 ,PC 对 汇编 程序 员 来 说 不 是 透明 的 。 答 案 是 选项 B。 

8. 每 条 指令 执行 结束 后 (对 于 循环 执行 的 指令 ,在 完成 所 有 次 数 的 循环 执行 后 , 称 为 指 
令 执行 结束 ) ,总 是 要 执行 新 的 指令 ,和 否则 程序 就 无 法 完成 执行 。 因 此 ,每 条 指令 执行 后 程序 
计数 器 PC 的 内 容 一 定 会 改变 。 如 何 改变 PC 的 内 容 呢 ? 主要 看 指令 是 顺序 执行 还 是 跳 转 
执行 ,若是 顺序 执行 , 则 PC 的 值 总 是 自动 加 上 当前 执行 指令 的 长 度 ,通常 用 “1” 表 示 , 这 里 
的 “1” 是 指 一 条 指令 的 长 度 ,所 以 ,选项 BB 的 说 法 是 错误 的 。 

调用 指令 和 无 条 件 转 移 指令 都 是 无 条 件 跳 转 到 转移 目标 地 址 执行 ,调用 指令 的 转移 目 
标 地 址 就 是 被 调用 过 程 的 首 地 址 ,因此 ,PC 的 值 都 要 改变 为 转移 目标 地 址 。 

综 上 所 述 ,答案 为 选项 B。 

11. 处 理 器 根据 自身 的 时 钟 信号 来 对 指令 的 执行 进行 定时 ,但 是 ,并 不 是 每 来 一 个 时 钟 
信号 就 开始 执行 一 条 新 的 指令 ,例如 ,在 多 周期 处 理 器 中 ,一 条 指令 的 执行 需要 分 解 成 多 个 
阶段 进行 ,每 个 阶段 在 一 个 时 钟 周期 内 完成 一 个 特定 的 功能 ,因此 ,每 来 一 个 时 钟 开始 执行 
一 个 阶段 性 操作 。 因 此 ,选项 A 的 说 法 是 错误 的 。 

每 来 一 个 时 钟 开始 进行 阶段 性 操作 ,因此 ,必须 确定 时 钟 的 哪 一 刻 算 开始 ,通常 这 个 开 
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始点 或 是 时 钟 信号 的 上 升 沿 或 是 下 降 沿 , 称 为 触发 边沿 。 触 发 器 或 寄存 器 等 状态 元 件 总 是 
在 触发 边沿 开始 改变 状态 。 

为 了 保证 每 个 阶段 的 操作 都 能 在 一 个 时 钟 周期 内 完成 ,时 钟 周 期 必须 足够 长 ,以 保证 数 
据 在 最 长 延迟 的 组 合 逻辑 电路 中 能 够 传输 完成 。 因 此 ,时钟 周期 以 相 邻 状态 单元 之 间 最 长 
组 合 逻 辑 延 迟 为 基准 确定 。 

12. 数据 通路 就 是 指令 执行 过 程 中 数据 流动 所 经 过 的 路 径 及 其 路 径 上 的 部 件 , 这 些 部 
件 或 者 是 组 合 逻 辑 元 件 或 者 是 时 序 迎 辑 元 件 ,前 者 称 为 操作 元 件 ,后 者 称 为 状态 元 件 ,因此 ， 
数据 通路 就 是 由 若干 操作 元 件 和 状态 元 件 连 接 而 成 的 。 数 据 通路 的 功能 由 控制 部 件 送出 的 
控制 信号 决定 。 数 据 通路 中 一 个 重要 的 操作 元 件 为 ALU, 用 于 执行 各 类 算术 和 好 辑 运算 ; 
另 一 个 重要 的 元 件 为 通用 寄存 器 ,属于 状态 元 件 。 

综 上 所 述 ,选项 D 中 的 说 法 是 错误 的 。 

13. 取 指令 阶段 是 指令 周期 中 的 第 一 个 阶段 ,主要 完成 从 指令 存储 器 中 取出 指令 的 功 
能 。 因 此 , 取 指 令 操 作 的 时 延 主要 由 存储 器 的 取 数 时 间 决 定 。 

如 果 是 定 长 指令 字 , 那 么 指令 长 度 是 固定 的 ,无 需 对 指令 译 码 即 可 确定 指令 长 度 , 因 此 ， 
在 取 指令 的 同时 ,可 以 对 PC 进行 增 量 处 理 以 计算 出 顺序 执行 时 下 条 指令 的 地 址 。 

对 于 单 周期 数据 通路 ,一 条 指令 执行 的 结果 总 是 在 下 一 个 时 钟 周期 开始 时 写 入 状态 元 
件 ,而 在 指令 执行 过 程 中 没有 任何 状态 元 件 被 写 人 信息 ,否则 一 个 指令 周期 不 可 能 在 一 个 时 
钟 周期 内 完成 。 选 项 C 的 意思 是 ,在 单 周期 处 理 器 的 指令 周期 中 , 取 指令 阶段 需要 先 将 指 
令 取出 后 放 在 指令 寄存 器 (是 一 种 状态 元 件 ) 中 ,然后 再 从 指令 寄存 器 中 取出 来 执行 ,显然 ， 
这 种 说 法 是 错误 的 。 

PC 在 单 周期 数据 通路 中 不 需要 “ 写 使 能 ”控制 信号 ,因为 单 周期 处 理 器 中 每 个 时 钟 周 
期 等 于 一 个 指令 周期 ,因此 ,每 个 时 钟 周期 都 要 改变 PC 的 值 ,从 而 不 需要 “ 写 使 能 ”信息 来 
区 分 何 时 需要 写 PC、 何 时 无 须 写 PC。 

14. 多 周期 数据 通路 中 ,每 条 指令 的 CPI 可 能 不 同 ,复杂 指令 的 CPI 比 简单 指令 的 CPI 
更 大 ,而 单 周期 数据 通路 中 每 条 指令 的 CPI 都 是 1, 因 此 , 比 多 周期 处 理 器 的 CPI 大 。 可 见 ， 
选项 A 的 说 法 是 错误 的 。 

15. MIPS 架构 的 R 型 指令 的 功能 是 ,对 两 个 通用 寄存 器 中 的 内 容 进行 相应 的 算术 、 他 
辑 运 算 等 操作 ,其 结果 再 保存 到 某 个 通用 寄存 器 中 。 因 此 ,其 数据 通路 中 一 定 会 有 一 个 具有 
读 口 和 写 口 的 通用 寄存 器 组 .一 个 ALU 用 于 对 寄存 器 读 出 数据 进行 运算 ,也 一 定 存在 一 条 
路 径 使 ALU 输出 被 送 到 某 个 寄存 器 ,通用 寄存 器 堆 的 “ 写 使 能 "控制 信号 一 定 为 1, 使 得 运 
算 结果 能 写 人 某 个 通用 寄存 器 。 因 此 ,选项 D 是 正确 的 。 

16. MIPS 架构 的 lw/sw 指令 的 功能 是 ,将 某 寄 存 器 和 偏 移 量 (16 位 立即 数 符号 扩展 成 
32 位 ) 相 加 的 结果 作为 存储 地 址 ,lw 指令 将 该 地 址 中 的 内 容 取出 , 送 到 另 一 个 寄存 器 中 ;sw 
指令 则 将 另 一 个 寄存 器 的 内 容 存储 到 该 地 址 中 。 因 此 ,其 数据 通路 中 ,一 定 有 一 个 符号 扩展 
部 件 用 于 偏 移 量 的 扩展 ,而 且 ALU 的 控制 信号 一 定 为 addu(ALU 做 加 法 ) ,寄存 器 堆 的 “ 写 
使 能 ”信号 在 lw 指令 执行 时 为 1 ,在 sw 指令 执行 时 为 0, 数据 存储 器 的 “ 写 使 能 ”信号 在 lw 
指令 执行 时 为 0, 在 sw 指令 执行 时 为 1。 因 此 ,选项 D 是 正确 的 。 

17. MIPS 架构 的 beq 指令 的 功能 是 ,根据 指令 指定 的 两 个 寄存 器 内 容 是 否 相等 (通过 
做 减法 来 比较 是 否 相 等 ) ,确定 是 否 跳 转 到 指定 的 转移 目标 地 址 执行 。 因 此 ,其 单 周期 数据 
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通路 设计 中 ,ALU 的 两 个 输入 都 来 自 寄存 器 堆 ,ALU 的 控制 信号 一 定 为 subu( 即 ALU 做 
减法 ) ,并 且 , 一 定 有 一 个 加 法 器 用 于 计算 转移 目标 地 址 。 因 为 转移 目标 地 址 的 计算 需要 将 
PC 的 内 容 和 偏 移 量 (16 位 立即 数 符号 扩展 为 32 位 ) 相 加 ,所 以 ,数据 一 定 会 流 经 符号 扩展 
部 件 。 因 此 , @ .@ .@ 的 叙述 是 正确 的 , 即 正确 选项 为 A。 

18. 根据 题目 的 描述 可 知 , 取 数 Load 是 最 复杂 的 指令 ,在 该 单 周期 数据 通路 中 ,应 该 以 
Load 所 用 时 间作 为 时 钟 周期 。 因 此 ,在 不 考虑 多 路 复 用 器 、 控 制 单元 .PC、 符 号 扩展 单元 和 
传输 线路 等 延迟 的 情况 下 ,该 计算 机 时 钟 周期 为 取 指令 时 间 (3ns) 十 寄存 器 堆 的 读 取 时 间 
(lns) 十 ALU 运算 时 间 (2ns) 十 存储 器 取 数 时 间 (3ns) 十 寄存 器 堆 写 时 间 (lns) 王 10ns。 选 
项 C 是 正确 的 。 


5.6 分 析 应 用 题 


1. 某 计算 机 主 频 为 800MHz, 其 CPU 采用 三 级 时 序 ( 机 器 周期 一 节拍 一 脉冲 ) 进 行 定 
时 ,为 单 脉冲 节拍 方式 ,每 个 机 器 周期 的 基本 宽度 为 4 个 节拍 。 该 机 每 个 指令 周期 平均 有 
5 个 机 器 周期 ,并 平均 访问 2 次 主 存 ,采用 非 缓存 ( 即 无 cache) 访 问 。 请 回答 下 列 问 题 : 

(1) 车 采用 异步 方式 访问 内 存 , 每 个 “存储 器 读 ” 机 器 周期 平均 需 8 个 节拍 ,每 个 “存储 
器 写 " 机 器 周期 平均 需 6 个 节拍 , 则 执行 一 条 指令 的 平均 时 间 为 多 少 ? MIPS 数 为 多 少 ? 平 
均 CPI 为 多 少 ? 

(2) 若 采 用 同步 方式 访问 内 存 ,每 个 “存储 器 读 ” 机 器 周期 需 在 基本 宽度 的 基础 上 再 插 
和 人 4 个 “等 待 ”状态 ,每 个 “存储 器 写 " 机 器 周期 无 需 “等 待 ”状态 , 则 执行 一 条 指令 的 平均 时 间 
为 多 少 ? MIPS 数 为 多 少 ? 平均 CPI 为 多 少 ? (提示 : 一 个 “等 待 状态 ” 即 是 一 个 节拍 ) 

【分 析 解 答 】 

早期 的 计算 机 中 没有 cache,CPU 访 存 时 ,由 于 主 存 速度 慢 ,无 法 像 访问 寄存 器 或 cache 
那样 能 在 一 个 节拍 内 存 取 好 数据 ,因此 ,需要 CPU 等 待 若干 个 节拍 才能 完成 存储 访问 。 因 
而 “存储 器 读 ” 和 “存储 器 写 " 机 器 周期 比 基 本 的 无 访 存 操作 机 器 周期 长 。 

(1) CPU 和 主 存 之 间 采 用 异步 方式 通信 时 ,CPU 每 次 发 送 读 或 写 命令 后 , 便 在 随后 的 
每 个 节拍 内 采样 主 存 送 来 的 “存储 操作 完成 "(MFC) 信 号 ,以 便 在 主 存 数据 准备 好 时 ,到 存 
储 器 数据 寄存 器 (MDR) 中 取 数 据 。 由 题 意 可 知 ,在 异步 方式 下 ,每 条 指令 的 平均 时 钟 周期 
(节拍 ) 数 为 (5 一 2) X4 十 2X((8 十 6)/2) 二 26, 所 以 CPI=26。 执 行 一 条 指令 的 平均 时 间 为 
26X1/(800X10 Hz)==0. 325ns。MIPS 数 为 800/26 守 31。 

(2) CPU 和 主 存 之 间 采 用 同步 方式 通信 时 ,CPU 每 次 发 送 读 或 写 命令 后 , 便 按照 同步 
通信 协议 ,等 待 一 个 固定 长 度 的 时 间 ( 若 干 个 节拍 ) 后 ,到 存储 器 数据 寄存 器 (MDR) 中 取 数 
据 。 由 题 意 可 知 ,在 同步 方式 下 ,每 条 指令 的 平均 时 钟 周期 (节拍 ) 数 为 (5 一 2) X 4 十 2X 
((4 十 4 十 4)/2) 一 24, 所 以 CPI 二 24。 执 行 一 条 指令 的 平均 时 间 为 24X1/(800X10" Hz)= 
0. 3ns。MIPS 数 为 800/24s*33。 

2. 某 计算 机 字 长 16 位 ,采用 16 位 定 长 指令 字 结 构 ,部 分 数据 通路 结构 如 图 5. 8 所 示 。 
假设 MAR 的 输出 一 直 处 于 使 能 状态 。 加 法 指令 *ADD (R1),R0” 的 功能 为 MUR[R1]] 一 
M[R[R1]] 十 R[RO]。 

表 5. 2 给 出 了 上 述 指令 取 指 和 译 码 阶段 每 个 节拍 (时 钟 周期 ) 的 功能 和 有 效 控制 信号 ， 
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图 5.8 题 2 中 的 数据 通路 


请 按 表 中 描述 方式 列 出 指令 执行 阶段 每 个 节拍 的 功能 和 有 效 控制 信号 ,并 说 明 需 要 多 少 




















节拍 。 
表 5.2 题 2 中 取 指 令 阶段 的 控制 信号 
时 钟 功 能 有 效 控制 信号 
Gil MAR< (PC) PCout, MARin 
国 MDR<-M(MAR) MemR 
PC*(PC)+1 PC+1 
C3 IR*(MDR) MDRout, IRin 
C4 指令 译 码 无 
【分 析 解 答 】 


加 法 指令 “ADD(R1),R0” 的 执行 阶段 每 个 节拍 的 功能 和 控制 信号 如 表 5. 3 所 示 。 


表 5.3 题 2 中 指令 执行 阶段 的 控制 信号 








四 功 能 有 效 控制 信号 
名 MAR<(R1) Rlout, MARin 
MDR<M(MAR) - 
A<(R0) MemR ROout, Ain 
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续 表 
时 钟 功 能 有 效 控制 信号 
C7 AC<A+(MDR) MDRout, Add 
C8 MDR<(AC) ACout, MDRin 
C9 M(MAR)<MDR MemW 








从 表 5. 3 可 以 看 出 ,在 C6 节拍 中 同时 进行 了 存储 器 读 和 寄存 器 之 间 传送 ,这 样 ,该 指 
令 的 执行 阶段 共有 5 个 节拍 。 当 然 ,也 可 将 存储 器 读 和 寄存 器 之 间 传 送 操作 安排 在 不 同 的 
节拍 内 进行 ,这 样 得 到 表 5.4。 此 时 ,执行 阶段 共有 6 个 节拍 。 


表 5.4 题 2 中 指令 执行 阶段 的 控制 信号 




















时 钟 功 能 有 效 控制 信号 
C5 MAR< (CR1) Rlout,MARin 
C6 MDR<-M(MAR) MemR 

C7 A<(MDR) MDRout, Ain 
C8 AC<A + (RO) ROout, Add 
C9 MDR<(AC) ACout, MDRin 
C10 M(MAR)<-MDR MemW 








3. 假定 在 如 图 5. 9 所 示 的 单 总 线 数据 通路 中 ,总 线 传输 延迟 和 ALU 运算 时 间 分 别 是 
20ps 和 200ps, 寄 存 器 建立 时 间 为 10ps, 寄 存 器 保持 时 间 为 5ps, 寄 存 器 的 锁 存 延迟 (Clk-to-Q 
time) 为 4ps, 控 制 信号 的 生成 延迟 (Clk-to-signal time) 为 7ps, 三 态 门 接 通 时 间 为 3ps, 则 从 


当前 时 钟 到 达 开始 算 起 ,完成 以 下 操作 的 最 短 时 间 是 多 少 ? 各 需要 几 个 时 钟 周期 ? 


(1) 将 数据 从 一 个 寄存 器 传送 到 另 一 个 寄存 器 。 
(2) 将 程序 计数 器 PC 加 1。 
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图 5.9 单 总 线 数据 通路 
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【分 析 解 答 】 

图 5.9 所 示 的 数据 通路 中 ,所 有 与 内 部 总 线 相连 的 寄存 器 都 有 相应 的 Rin 和 /或 Rout 
控制 信号 ,以 控制 总 线 和 寄存 器 之 间 的 数据 传送 。 总 线 和 ALU 输入 端 之 间 、Y 寄存 器 与 
ALU 输入 端 之 间 都 无 需 控制 信号 。ALU 输出 与 Z 寄存 器 之 间 可 以 有 控制 信号 Zin, 也 可 
以 没有 。 若 没有 Zin, 则 每 来 一 个 时 钟 ,ALU 的 输出 总 是 被 写 入 Z 寄存 器 。 以 下 说 明 中 ,为 
了 明显 表示 ALU 输出 送 Z 寄存 器 ,假定 有 控制 信号 Zin。 

图 5. 10 给 出 了 单 总 线 数据 通路 中 主要 路 径 的 定时 。 时 钟 边沿 到 达 后 ,经 过 Clk-to-Q 
延 时 ,寄存 器 中 的 内 容 被 读 出 ,同时 ,在 指令 译 码 器 中 的 控制 多 辑 生 成 当前 时 钟 周期 内 所 需 
的 控制 信号 ,其 延 时 为 Clk-to-signal。 随 后 ,由 生成 的 控制 信号 Riout 接 通 三 态 门 ,并 使 寄 
存 器 数据 在 总 线 上 传输 。 若 当前 时 钟 周期 内 不 做 ALU 运算 而 是 直接 在 寄存 器 之 间 传 送 ， 
则 总 线 上 的 数据 在 Rjin 的 控制 下 直接 被 送 到 目的 寄存 器 Rj 的 输入 端 ,在 下 一 个 时 钟 边沿 
到 来 之 前 ,总 线 上 的 数据 必须 继续 稳定 一 段 寄 存 器 建立 时 间 , 以 使 寄存 器 Rj 的 输入 在 这 段 
建立 时 间 内 保持 不 变 , 如 图 5.10(a) 所 示 ; 若 当前 时 钟 周期 内 有 ALU 运算 , 则 还 需 ALU 电 
路 延 时 ,最 后 ALU 结果 直接 送 Z 寄存 器 ,在 下 一 个 时 钟 边沿 到 来 之 前 ,ALU 的 输出 必须 继续 
稳定 一 段 寄 存 器 建立 时 间 , 以 使 寄存 器 Z 的 输入 在 这 段 建立 时 间 内 保持 不 变 , 如 图 5. 10(b) 
所 示 。 
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(a) 当前 周期 内 不 执行 ALU 运 算 
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(b) 当前 周期 内 执行 ALU 运 算 
5.10 单 总 线 数据 通路 中 主要 路 径 的 定时 


由 天 处 理 器 


(1) 由 图 5. 10(a) 可 知 ,寄存 器 之 间 进 行 传送 的 时 间 延 迟 至 少 为 7 十 3 十 20 十 10 一 40ps。 
在 这 个 寄存 器 数据 传送 过 程 中 ,只 需要 在 一 个 寄存 器 中 保存 信息 ,因此 只 需要 一 个 时 钟 周期 
就 可 完成 该 操作 。 

(2) 将 PC 中 的 内 容 加 1 送 PC, 被 分 解 成 以 下 两 个 过 程 : PC 加 1 送 Z.Z 送 PC。 对 于 
第 一 个 过 程 , 由 图 5.10(b) 可 知 ,其 延迟 至 少 为 7 十 3 十 20 十 200 十 10 二 240ps; 第 二 个 过 程 实 
现 的 是 寄存 器 之 间 的 传送 ,因此 延迟 至 少 为 40ps。 因 为 在 该 操作 过 程 中 保存 了 两 次 信息 ， 
所 以 需要 两 个 时 钟 周期 才能 完成 该 操作 。 

4. 假定 某 计算 机 字 长 16 位 ,CPU 内 部 结构 如 图 5. 9 所 示 ,CPU 和 存储 器 之 间 采 用 同 
步 方式 通信 , 按 字 编 址 。 采 用 定 长 指令 字 格 式 , 指 令 由 两 个 字 组 成 ,第 一 个 字 指 明 操作 码 和 
寻 址 方式 ,第 二 个 字 包 含 立 即 数 Imm16。 若 一 次 存储 访问 所 用 时 间 为 两 个 时 钟 周期 (用 
Readl 和 Read2 分 别 表示 两 个 时 钟 周期 内 的 操作 控制 信号 ) ,每 次 存储 访问 存 取 一 个 字 , 取 
指令 阶段 第 二 次 访 存 将 Imm16 取 到 MDR 中 。 请 写 出 下 列 指令 在 执行 阶段 (不 考虑 取 指 令 
过 程 ) 的 控制 信号 序列 ,并 说 明 需 要 几 个 时 钟 周期 。 

(1) 将 Imm16 加 到 寄存 器 R1 中 ,此 时 ,Imml6 为 立即 操作 数 , 即 RLR1]<-RLR1I] 十 
Imml6 。 

(2) 将 存储 单元 Imm16 中 的 内 容 加 到 寄存 器 R1 中 ,此 时 , Imm16 为 直接 地 址 , 即 
R[R1]<R[IR1]+M[Imm16], 

(3) 将 存储 单元 Imm16 中 的 内 容 作 为 地 址 访问 主 存 ,将 读 出 的 内 容 再 作为 地 址 访问 主 
存 ,然后 将 读 出 的 内 容 加 到 寄存 器 Rl1 中 ,此 时 ,Imm16 为 间接 地 址 , 即 RLR1]<RLR1] 十 
M[M[Imm16]]。 

【分 析 解 答 】 

图 5.9 所 示 的 数据 通路 中 ,所 有 与 内 部 总 线 相连 的 寄存 器 都 有 相应 的 Rin 和 /或 Rout 
控制 信号 ,以 控制 总 线 和 寄存 器 之 间 的 数据 传送 。 总 线 和 ALU 输入 端 之 间 、Y 寄存 器 与 
ALU 输入 端 之 间 都 无 需 控 制 信号 。ALU 输出 与 Z 寄存 器 之 间 可 以 有 控制 信号 Zin ,也 可 
以 没有 ,此 时 ,每 来 一 个 时 钟 ,ALU 的 输出 总 是 被 写 人 Z 寄存 器 。 为 了 明显 表示 ALU 输出 
送 Z 寄存 器 ,这 里 假定 有 控制 信号 Zin。 

另外 要 说 明 的 是 ,以 下 给 出 的 是 指令 执行 阶段 的 控制 信号 ,因此 ,在 执行 阶段 的 开始 , 取 
指令 阶段 已 经 结束 ,此 时 ,指令 的 第 二 个 字 (Imm16) 已 经 从 存储 器 中 取出 并 被 存放 在 
MDR 中 。 

(1) 指令 功能 为 RUR1]<-R[R1] 二 Imml16 时 ,执行 阶段 不 需要 访 存 操作 。 因 此 ,可 用 以 
下 3 个 时 钟 周期 完成 : 

MDRout, Yin 

Rlout, add, Zin 

Zout, Rlin 

(2) 指令 功能 为 RER1]<-R[ER1] 十 M[Imm16] 时 ,执行 阶段 需要 一 次 访 存 操作 ,因此 ， 
至 少 需要 以 下 5 个 时 钟 周期 : 

MDRout, MARin 

Readl, (Rlout, Yin) 

Read?2, Rlout, Yin 
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MDRout, add, Zin 

Zout, Rlin 

其 中 Rlout，Yin 这 两 个 控制 信号 可 以 与 Readl 控制 信息 同时 送出 ,并 在 Read2 操作 
阶段 保持 不 变 , 也 可 以 延迟 到 与 Read2 同时 送出 。 

(3) 指令 功能 为 RLR1]<RLRI] 二 MLM[Imml16]] 时 ,执行 阶段 需要 两 次 访 存 操作 , 因 
此 ,至 少 需要 以 下 8 个 时 钟 周期 : 

MDRout，MARin 

Readl 

Read2 

MDRout, MARin 

Readl, (Rlout, Yin) 

Read2, Rlout, Yin 

MDRout, add, Zin 

Zout, Rlin 

对 Rlout，Yin 这 两 个 控制 信号 的 处 理 同 (2) 中 一 样 。 

5. 图 5.11 给 出 了 某 CPU 内 部 结构 的 一 部 分 ,MAR 和 MDR 直接 连 到 存储 器 总 线 (图 
中 省 略 )。 在 两 个 总 线 之 间 的 所 有 数据 传送 都 需 经 过 算术 











总 线 A 总 线 B 
逻辑 部 件 ALU。ALU 的 部 分 功能 及 其 控制 信号 如 下 : 
MOVa: F=A;MOVb: F=B; i 
a+1: F=A+1;b+1: F=B+1 | i | 

















a 一 1; F=A—1;b—1: F=B-1 

其 中 A 和 B 是 ALU 的 输入 'F 是 ALU 的 输出 。 假 
定 调用 指令 CALL 占 两 个 字 , 第 一 个 字 是 操作 码 , 第 二 个 ?0 | 
字 给 出 子 程序 的 起 始 地 址 ,返回 地 址 保存 在 主 存 的 栈 中 ， | sp | 
用 SP( 栈 项 指针 寄存 器 ) 指 向 栈 项 , 按 字 编 址 ,每 次 按 同步 
方式 从 主 存 读 取 一 个 字 。 请 写 出 读 取 并 执行 CALL 指令 


”| MAR Eo” 


















































所 要 求 的 控制 信号 序列 (提示 : 当前 指令 地 址 在 PC 中 )， Al B 
并 说 明 至 少 需要 多 少 个 时 钟 周期 。 
【分 析 解答 ] 


因为 采用 同步 方式 读 写 内 存 , 所 以 在 read 和 write 信 图 5.11 题 5 中 的 图 示 
号 后 不 需 加 等 待 信号 WMFC。CALL 指令 有 两 个 字 , 按 
字 编 址 ,每 次 从 主 存 读 取 一 个 字 ,因此 ,CALL 指令 需要 读 两 次 主 存 , 一 次 是 读 取 指令 中 的 操 
作 码 , 另 一 次 是 读 取 指令 中 给 出 的 子 程序 首 地 址 。 其 指令 周期 分 为 以 下 三 个 阶段 。 

(1) 读 取 指 令 操作 码 : 将 PC 的 内 容 作 为 地 址 访问 存储 器 ,取出 指令 的 操作 码 , 送 指令 
寄存 器 IR, 同 时 PC 十 1 送 PC, 以 指向 指令 的 第 二 个 字 , 至 少 需 要 三 个 时 钟 周期 (节拍 ): 

PCout, MOVb, MARin 

Read, b+1, PCin 

MDRout, MOVb, IRin 

(2) 取 子 程序 首 地 址 : 将 PC 的 内 容 作为 地 址 ,取出 指令 的 第 二 个 字 ( 即 子 程序 人 口 地 
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址 ) 送 PC, 以 使 下 一 个 指令 周期 从 子 程序 的 第 一 条 指令 开始 执行 。 同 时 ,计算 PC 十 1 以 得 
到 返回 地 址 , 送 Y 寄存 器 ,至 少 需要 3 个 时 钟 周 期 : 

PCout, MOVb, MARin 

Read, b 十 1，Yin 

MDRout，MOVb, PCin 

(3) 保存 返回 地 址 至 栈 中 : 将 临时 保存 在 Y 寄存 器 的 返回 地 址 送 到 栈 顶 保存 ,并 自动 
调整 栈 顶 指针 。 至 少 需要 3 个 时 钟 周期 : 

SPout, MOVb, MARin 

Yout, MOVb, MDRin 

Write, SPout, b—1, SPin 

显然 ,上 述 每 个 节拍 中 执行 的 操作 所 需要 的 时 间 不 等 ,其 中 ,存储 访问 (read/write) 时 
间 最 长 ,时 钟 周期 以 最 长 的 存储 访问 时 间 为 准 ,CALL 指令 的 指令 周期 至 少 有 9 个 时 钟 周期 
(节拍 )。 

如 果 将 第 一 次 PC 十 1 的 结果 送 到 Y 寄存 器 ,第 二 阶段 以 Y 的 内 容 作为 地 址 访问 主 存 ， 
并 继续 对 Y 寄存 器 加 1, 结果 送 PC, 则 也 能 实现 CALL 指令 的 功能 。 这 种 方式 下 ,也 是 9 个 
时 钟 周期 。 

6. 某 计算 机 字 长 16 位 ,标志 寄存 器 Flag 中 的 ZF、SF 和 OF 分 别 是 零 标志 、 符 号 标志 
和 溢出 标志 ,采用 双 字 节 定 长 指令 字 。 假 定 bgt( 大 于 零 转移 ) 指 令 的 第 一 个 字 节 指明 操作 
码 和 寻 址 方式 ,第 二 个 字 节 为 偏 移 地 址 Imm8 ,用 补 码 表示 。 指 令 功能 是 : 若 (ZF 十 (SF 四 
OF)=0), 则 PC=PC 十 2 十 Imm8X2, 和 否则 PC=PC 十 ?2。 请 回答 下 列 问 题 或 完成 相应 任务 。 

(1) 该 计算 机 的 编 址 单位 是 多 少 ? 

(2) bgt 指令 执行 的 是 带 符号 整数 比较 还 是 无 符号 整数 比较 ? 偏 移 地 址 Imm8 的 含义 
是 什么 ? 转移 目标 地 址 的 范围 是 什么 ? 

(3) 夯 出 实现 bgt 指令 的 数据 通路 。 

【分 析 解 答 】 

(1) 因为 PC 的 增 量 是 2, 且 每 条 指令 占 2 个 字 节 ,所 以 编 址 单位 是 字 节 。 

(2) 根据 “大 于 ”条 件 判断 表达 式 ,可 以 看 出 该 bgt 指令 实现 的 是 带 符号 整数 比较 。 因 
为 无 符号 数 比较 时 ,其 判断 表达 式 中 没有 溢出 标志 OF 。 偏 移 地 址 Imm8 为 补 码 表示 ,说 明 
转移 目标 指令 可 能 在 bgt 指令 之 前 ,也 可 能 在 bgt 指令 之 后 。 计 算 转 移 目标 地 址 时 , 偏 移 量 
为 Imm8X2, 说 明 Imm8 不 是 相对 地 址 ,而 是 相对 指令 条 数 。Immsg 的 范围 为 一 128 一 127， 
故 转移 目标 地 址 的 范围 是 PC 十 2 十 (一 128X2)~~PC 十 2 十 127X2, 也 即 转移 目标 地 址 的 范 
围 是 相对 于 bgt 指令 的 前 254 个 单元 到 后 256 个 单元 之 间 , 用 指令 条 数 来 衡量 的 话 , 就 是 相 
对 于 bgt 指令 的 前 127 条 指令 到 后 128 条 指令 之 间 。 

(3) 实现 bgt 指令 的 数据 通路 如 图 5. 12 所 示 。 

7. 如 果 图 5. 4 给 出 的 单 周 期 数据 通路 对 应 的 控制 逻辑 发 生 错误 ,使 得 控制 信号 
RegWr、RegDst、Branch、MemWr、ExtOp 中 某 一 个 在 任何 情况 下 总 是 为 0, 则 该 控制 信号 为 
0 时 哪些 指令 不 能 正确 执行 ? 要求 分 别 对 每 个 控制 信号 进行 讨论 。 

【分 析 解 答 】 

车 RegWr 二 0, 则 所 有 需 写 结果 到 寄存 器 的 指令 (如 R- 型 指令 .load 类 指令 等 ) 都 不 能 正 
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5.12 bgt 指令 的 数据 通路 


确 执 行 ,因为 寄存 器 不 发 生 写 操作 。 

若 RegDst=0, 则 所 有 R- 型 指令 都 不 能 正确 执行 ,因为 目的 寄存 器 指定 为 Rt 而 不 
是 Rd。 

若 Branch 二 0, 则 branch 类 指令 可 能 出 错 ,因为 永远 不 会 发 生 转移 。 

若 MemWr=0, 则 store 类 指令 不 能 正确 执行 ,因为 存储 器 不 能 写 入 所 需 数据 。 

车 ExtOp 二 0, 则 需要 符号 扩展 的 指令 (如 beq、lw/sw 等 ) 发 生 错 误 ,因为 进行 的 是 0 
扩展 。 

8. 如 果 图 5. 4 给 出 的 单 周期 数据 通路 对 应 的 控制 好 辑 发 生 错 误 ,使 得 控制 信号 
RegWr、RegDst、Branch、MemWr、ExtOp 中 某 一 个 在 任何 情况 下 总 是 为 1, 则 该 控制 信号 为 
1 时 哪些 指令 不 能 正确 执行 ?要 求 分 别 对 每 个 控制 信号 进行 讨论 。 

【分 析 解 答 】 

若 RegWr 一 1, 则 所 有 不 需 写 结果 到 寄存 器 的 指令 (如 sw、beq 等) 都 不 能 正确 执行 , 因 
为 可 能 错误 地 将 某 个 值 写 人 了 某 个 寄存 器 。 

若 RegDst=1, 则 lw 等 部 分 工 型 指令 不 能 正确 执行 ,因为 目的 寄存 器 指定 为 Rd 而 不 是 
Rts 

若 Branch=1, 则 非 branch 类 指令 可 能 出 错 ,因为 可 能 会 发 生 不 必要 的 转移 。 

若 MemWr=1, 则 除 store 类 指令 外 其 他 指令 都 不 能 正确 执行 ,因为 会 写 入 数据 到 存 
储 器 。 

车 ExtOp 二 1, 则 需要 零 扩 展 的 指令 (如 ori 等) 会 发 生 错误 ,因为 进行 的 是 符号 扩展 。 

9. 如 果 图 5. 6 给 出 的 多 周期 数据 通路 对 应 的 控制 逻辑 发 生 错误 ,使 得 控制 信号 
PCWrIRWr、RegWr、BrWr、PCSource .MemWr、MemtoReg、.PCWrCond、R-type 中 某 一 个 
在 任何 情况 下 总 是 为 0, 则 该 控制 信号 为 0 时 哪些 指令 不 能 正确 执行 ?要 求 分 别 对 每 个 控 
制 信号 进行 讨论 。 

【分 析 解 答 】 

若 PCWr=0, 则 所 有 指令 都 不 能 正确 执行 ,因为 无 法 正确 地 更 新 PC。 

车 IRWr 二 0, 则 所 有 指令 都 不 能 正确 执行 ,因为 IR 中 不 能 写 入 当前 指令 ,也 就 无 法 进 
行 正确 的 指令 译 码 ,因此 后 续 的 指令 执行 过 程 都 不 正确 。 


史 风 处理 器 


若 RegWr 二 0, 则 所 有 需要 写 结果 到 寄存 器 的 指令 (如 R- 型 指令 lw 等 部 分 工 型 指令 ) 
都 不 能 正确 执行 ,因为 寄存 器 不 发 生 写 操作 。 

若 PCSource 二 00, 则 除 j 指令 之 外 的 其 他 指令 都 不 能 正确 得 到 下 条 指令 地 址 。 

若 MemWr=0, 则 所 有 store 类 指令 执行 错误 ,因为 数据 不 能 写 人 存储 器 中 。 

若 MemtoReg 一 0, 则 所 有 load 类 指令 执行 错误 ,因为 写 人 寄存 器 的 是 ALU 输出 而 不 
是 读 出 的 存储 单元 的 内 容 。 

若 PCWrCond=0, 则 branch 类 指令 执行 可 能 出 错 , 因 为 永远 不 会 发 生 转移 。 

若 R-type 二 0, 则 所 有 R- 型 指令 的 执行 可 能 出 错 , 因 为 控制 信号 ALUctr 的 取 值 不 是 来 
自 对 R- 型 指令 进行 解释 的 ALU 局 部 控制 器 。 

10. 如 果 图 5. 6 给 出 的 多 周期 数据 通路 对 应 的 控制 逻辑 发 生 错误 ,使 得 控制 信号 
PCWr JIRWr、RegWr、BrWr、PCSource.MemWr、MemtoReg .PCWrCond、R-type 中 某 一 个 
在 任何 情况 下 总 是 为 1, 则 该 控制 信号 为 1 时 哪些 指令 不 能 正确 执行 ? 要 求 分 别 对 每 个 控 
制 信号 进行 讨论 。 

【分 析 解 答 】 

若 PCWr=1, 则 程序 执行 顺序 失控 ,因为 每 个 时 钟 都 会 更 新 PC 。 

若 IRWr==1, 则 所 有 指令 都 可 能 出 错 ,因为 每 个 时 钟 周期 都 会 写 入 IR ,因此 写 入 的 不 是 
当前 指令 。 

若 RegWr 二 1, 则 所 有 不 需 写 结果 到 寄存 器 的 指令 (如 sw、beq 等 ) 都 不 能 正确 执行 , 因 
为 错误 地 将 某 个 值 写 人 了 某 个 寄存 器 。 

若 PCSource 二 01, 则 j 指令 和 branch 类 指令 不 能 正确 得 到 下 条 指令 地 址 。 

若 MemWr 二 1, 则 除 store 类 指令 外 的 所 有 指令 执行 错误 ,因为 在 存储 器 写 人 了 不 该 写 
的 信息 。 

若 MemtoReg 二 1, 则 除 load 类 指令 外 的 所 有 指令 执行 错误 ,因为 选择 了 错误 的 信息 写 
和 人 寄存 器 。 

若 PCWrCond=1, 则 除 branch 类 指令 外 的 所 有 指令 可 能 出 错 ,因为 可 能 会 发 生 不 必要 
的 转移 。 

若 R-type 二 1, 则 所 有 非 R- 型 指令 的 执行 可 能 出 错 ,因为 控制 信号 ALUctr 的 取 值 来 自 
对 R- 型 指令 进行 解释 的 ALU 局 部 控制 器 。 

11. swap 指令 的 功能 是 实现 两 个 寄存 器 内 容 的 互 换 。 在 MIPS 指令 集中 增加 一 条 
swap 指令 有 两 种 方式 ,一 种 是 采用 伪 指 令 ( 软 件 ) 方 式 ,这 种 情况 下 , 当 执行 到 swap 指令 
时 ,用 若干 条 已 有 指令 构成 的 指令 序列 来 代替 实现 ; 另 一 种 做 法 是 改动 硬件 实现 swap 指 
令 ,这 种 情况 下 , 当 执行 到 swap 指令 时 , 则 直接 在 swap 指令 对 应 的 数据 通路 (硬件 ) 上 
执行 。 

(1) 写 出 MIPS 中 用 伪 指 令 方式 实现 “swap rs, rt” 时 的 指令 序列 。 

(2) 假定 用 硬件 实现 swap 指令 时 会 使 每 条 指令 的 执行 时 间 增 加 10%, 则 swap 指令 在 
程序 中 占 多 大 的 比例 才 值 得 用 硬件 方式 来 实现 ? 

(3) 采用 硬件 方式 实现 时 ,在 不 对 寄存 器 堆 进 行 修改 的 情况 下 ,能 否 在 单 周期 数据 通路 
中 实现 swap 指令 ? 对 于 多 周期 数据 通路 的 情况 又 怎样 ? 
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【分 析 解 答 】 

(1) 若 在 伪 指 令 “swap rs, rt” 的 指令 序列 中 使 用 除 rs 和 rt 以 外 的 额外 寄存 器 , 则 额外 
寄存 器 的 内 容 会 被 指令 序列 破坏 ,因此 , 伪 指 令 的 指令 序列 中 一 般 不 能 用 额外 寄存 器 。 伪 指 
今 “swap rsy rt” 的 指令 序列 包含 以 下 3 条 指令 ,没有 用 到 额外 寄存 器 。 


xor rs, rs, rt 
xor rt, rs,rt 


Xor rs, TS It 


(2) 假定 “swap rs, rt” 指 令 所 占 比例 为 zx(0 志 x 二 1) ,其 他 指令 比例 为 1 一 x, 则 用 硬件 
实现 该 指令 时 , 程序 执行 时 间 为 原来 的 1.1X (zx 十 1 一 zx)=1.1 倍 。 用 软件 实现 该 指令 时 ， 
程序 执行 时 间 为 原来 的 37 十 1 一 +==2z 十 1 售 。 因 此 , 当 1.1<2x 十 1 时 ,硬件 实现 才 有 意 
义 , 由 此 可 知 ,x>0.05, 也 即 ; 当 “swap rs, rt” 指 令 在 程序 中 的 比例 大 于 5% 时 , 才 值得 用 硬 
件 方式 来 实现 该 指令 。 

(3) 在 单 周期 数据 通路 中 ,所 有 指令 的 执行 都 在 一 个 时 钟 周期 内 完成 ,数据 总 是 在 时 钟 
边沿 被 写 人 寄存 器 堆 , 即 本 条 指令 执行 的 结果 总 是 下 条 指令 开始 ( 即 下 个 时 钟 到 来 ) 时 才 被 
写 到 寄存 器 堆 中 ,因此 一 个 时 钟 周 期 只 能 写 一 次 寄存 器 。 而 swap 指令 执行 过 程 中 需要 多 
次 写 寄存 器 ,在 不 对 寄存 器 堆 进 行 修改 的 情况 下 ,无 法 在 单 周期 数据 通路 中 实现 swap 指 
令 ; 对 于 多 周期 数据 通路 ,一 个 指令 周期 可 以 有 多 个 时 钟 周期 ,因而 可 以 多 次 写 寄存 器 , 因 
此 ,在 不 对 寄存 器 堆 进 行 修改 的 情况 下 ,swap 指令 可 以 在 多 周期 数据 通路 中 实现 。 

12. 已 知 MIPS 中 有 一 条 转移 指令 jr(jump register) ,其 指令 格式 如 下 : 

31 26 25 21 20 16 15 11 10 6 5 0 
000000 TS 0 0 0 001000 


其 功能 是 读 出 rs 寄存 器 的 内 容 送 PC。 若 使 图 5. 4 所 示 的 单 周期 数据 通路 也 能 执行 jr 
指令 , 则 如 何 修改 单 周期 数据 通路 ? 需要 增加 什么 控制 信号 ? 

【分 析 解 答 】 

jr 指令 采用 R- 型 指令 格式 ,其 中 的 rt 和 rd 字段 都 是 0, 也 即 rt=rd= $0。 因 为 MIPS 
处 理 器 中 寄存 器 $0 的 内 容 永远 是 全 0, 它 可 被 读 出 ,但 不 能 改变 其 值 ,因此 , 写 人 信号 对 寄 
存 器 $0 不 起 作用 ,因而 ,可 以 把 jr 指令 看 成 是 结果 送 PC 的 加 法 指令 ,其 功能 为 : RLrdj 一 
RLrsj 十 R[rt],PC<-R[Lrs] 十 RLrt]。 因 此 , 原 R- 型 指令 的 数据 通路 不 需要 改动 ,而 只 要 增加 
ALU 结果 送 PC 的 数据 通路 ,并 对 控制 信号 作 相 应 修改 即 可 。 具 体 修改 如 下 。 

(1) PC 的 输入 端 再 增加 一 个 来 源 : ALU 输出 ,因此 ,在 PC 输入 端 需 再 加 一 个 多 路 选 
择 器 MUX, 原 先 的 输入 作为 MUX 其 中 的 一 个 输入 , 另 一 个 输入 为 ALU 输出 。 

(2) 增加 一 个 控制 信号 JReturn, 用 于 对 新 加 MUX 进行 控制 ,执行 jr 指令 时 ,JReturn 二 1， 
选择 ALU 输出 送 PC; 执 行 其 他 指令 时 ,JReturn 二 0, 选 择 原来 的 输入 值 送 PC。 

(3) ALU 控制 器 中 增加 func 二 001000B 时 相应 的 译 码 输出 ,其 输出 控制 信号 取 值 为 
ALUctr=add。 

13. 假设 MIPS 指令 系统 中 有 一 条 工 型 带 符号 整数 比较 指令 “bgt rs, rt, Imm16”, 其 功 
能 为 : 若 RLrs]>>R[rt], 则 PC=PC 十 4 十 Imm16X4, 否 则 PC=PC 十 4。 

车 ALU 能 产生 ZF( 零 ) .SF( 符 号 ) 和 OF( 溢 出 ) 三 个 标志 的 输出 ,请 在 图 5.6 所 示 的 多 
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周期 数据 通路 中 增加 实现 bgt 指令 的 数据 通路 ,并 给 出 指令 在 执行 周期 中 相应 的 控制 信号 
取 值 。 

【分 析 解 答 】 

比较 指令 需要 对 两 个 寄存 器 rs 和 rt 中 的 内 容 做 减法 运算 (用 ALU 中 的 加 法 器 实现 )， 
ALU 根据 运算 结果 得 到 ZF、SF 和 OF 三 个 标志 信息 。 在 此 ,rs 和 rt 中 的 内 容 被 看 成 带 符 
号 整数 ,因此 ,判断 R[rs]>R[rg] 的 条 件 表达 式 为 ZF。 (SF @ OF)。 图 5.6 中 的 多 周期 数 
据 通路 已 能 支持 beq 指令 的 执行 ,而 beq 指令 和 bgt 指令 的 目标 转移 地 址 是 一 样 的 ,因此 ， 
只 要 在 图 5. 6 中 原先 beq 指令 的 条 件 判断 逻辑 基础 上 增加 bgt 指令 的 条 件 判断 逻辑 即 可 ， 
修改 后 的 数据 通路 如 图 5. 13 所 示 ,其 中 带 阴影 部 分 是 修改 或 增加 的 数据 通路 。 
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5.13 增加 了 bgt 指 令 的 多 周期 数据 通路 





在 多 周期 数据 通路 中 ,bgt 指令 与 beq 指令 一 样 ,都 需要 三 个 时 钟 周期 ,前 两 个 时 钟 周 
期 为 取 指 周期 和 译 码 / 取 数 周期 ,它们 在 所 有 指令 的 执行 过 程 中 都 是 一 样 的 ,第 三 个 周期 为 
执行 周期 ,在 此 周期 中 ,各 控制 信号 的 取 值 为 : beq 二 PCWr 一 MemWr= 二 IRWr 二 RegWr 
BrWr=R-type=0,bgt= ALUSelA=1,ALUSelB=00,ALUOp= sub, PCSource= 二 10, 其 余 
任意 。 

14. 已 知 MIPS 中 有 一 条 lui(load upper immediate) 指 令 , 其 指令 格式 如 下 : 
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31 2625 2120 1615 0 
| ol | oo | rn | Imm16 











其 功能 是 将 立即 数 Imm16 送 到 rt 寄存 器 的 高 16 位 , 低 16 位 补 0。 若 使 图 5. 6 所 示 的 
多 周期 数据 通路 也 能 执行 lui 指令 , 则 如 何 修改 该 多 周期 数据 通路 ? 需要 增加 什么 控制 信 
号 ? 该 指令 对 应 的 时 钟 周期 数 是 多 少 ? 除 取 指 周 期 和 译 码 / 取 数 周期 外 的 其 他 周期 中 控制 
信号 的 取 值 是 什么 ? 

【分 析 解 答 】 

lui 指令 采用 工 型 指令 格式 ,rs= $0。 因此 ,该 指令 的 功能 可 以 描述 成 RErt]<R[ $0] 
十 Imm16X2*。 因 此 ,只 要 在 图 5.6 中 对 原 扩展 器 稍 加 修改 ,然后 借助 荆 型 运算 类 指令 数据 
通路 就 可 实现 lui 指令 。 具 体 修改 如 下 。 

(1) 修改 原 扩展 器 ,使 其 具有 高 位 零 扩展 、 高 位 符号 扩展 和 低位 零 扩 展 三 种 扩展 功能 。 

(2) 控制 信号 EXTop 从 原来 的 1 位 扩展 为 2 位 ,用 于 控制 扩展 器 进行 三 种 扩展 操作 。 
可 以 定义 EXTop==01 时 进行 高 位 零 扩 展 ,EXTop 三 10 时 进行 高 位 符号 扩展 ,EXTop=11 
时 进行 低位 零 扩展 。 

该 指令 的 执行 过 程 同 工 型 运算 类 指令 ,因此 ,与 ori 指令 类 似 , 其 时 钟 周期 数 为 4。 第 
3 个 时 钟 周 期 各 控制 信号 取 值 为 : ALUSelA=1, ALUSelB=10, ALUOp==add, EXTop =11， 
MemtoReg = RegDst = RegWr = PCWr = PCWrCond = IRWr = MemWr = BrWr 
R-type 二 0, 其 余 任意 ;第 4 个 时 钟 周期 各 控制 信号 取 值 为 ALUSelA 二 RegWr==1,ALUSelB=10， 
ALUOp= add, EXTop = 11, MemtoReg = RegDst = PCWr = PCWrCond = IRWr = MemWr 
BrWr= 二 R-type 二 0, 其 余 任意 。 

15. 假定 图 5. 6 所 示 的 多 周期 数据 通路 中 寄存 器 堆 只 有 一 个 读 口 和 一 个 写 口 ,车 要 完 
成 和 原 数据 通路 相同 的 功能 , 则 需要 对 图 中 原 数据 通路 作 哪些 修改 ?与 之 对 应 的 有 限 状态 
机 又 如 何 修改 ? 每 条 指令 的 时 钟 周期 数 有 什么 变化 ? 

【分 析 解 答 】 

如 果 图 5. 6 所 示 的 多 周期 数据 通路 中 寄存 器 堆 改 成 只 有 一 个 读 口 ,那么 ,原来 可 以 同时 
读数 据 到 A 寄存 器 和 PB 寄存 器 ,现在 只 能 先 读 一 个 到 A, 再 读 一 个 到 B。 

由 于 A 和 B 两 个 寄存 器 共用 一 个 读 地 址 端口 ,所 以 在 读 地 址 端口 的 输入 端 要 加 一 个 多 
路 选择 器 及 其 控制 信号 RegRead, 用 于 选择 读 地 址 口 是 rs 还 是 rt。 可 以 定义 当 RegRead=0 时 
读 口 地 址 为 rs, 当 RegRead 二 1 时 读 口 地 址 为 rt。 

由 于 只 有 一 个 读数 据 端口 ,该 端口 的 数据 可 能 被 送 到 A, 也 可 能 被 送 到 B, 所 以 读数 据 
端口 的 输出 同时 连 到 A 和 B 的 输入 端 ,并 增加 一 个 控制 信号 AWr, 可 以 定义 当 AWr=1 时 
将 端口 数据 送 A, 在 AWr=0 时 将 端口 数据 送 B。 因 此 ,在 数据 通路 中 ,AWr 信号 直接 连 到 
A 的 “ 写 使 能 ” 线 ,而 将 AWr 信号 取 反 后 连 到 B 的 “ 写 使 能 ” 线 。 

由 于 每 个 时 钟 周期 只 能 读 取 一 个 操作 数 , 修 改 后 的 数据 通路 不 能 像 原先 的 数据 通路 那 
样 ,在 第 2 个 周期 ( 译 码 / 取 数 周期 ) 中 同时 读 取 rs 和 rt, 必须 修改 相应 的 有 限 状 态 机 。 可 以 
有 以 下 三 种 修改 方式 。 

(1) 将 原来 的 译 码 / 取 数 周期 再 分 成 两 个 周期 ,分 别 读 rs 到 A 和 读 rt 到 B, 并 在 其 中 一 
个 周期 中 投机 完成 转移 目标 地 址 计算 。 这 样 ,每 条 指令 的 执行 都 多 了 一 个 时 钟 周期 。 

(2) 在 原来 的 译 码 / 取 数 周期 中 先 读 rs 到 A, 对 于 R- 型 和 Branch 类 指令 ,再 增加 一 个 
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周期 来 读 rt 到 B; 对 于 其 他 不 需 用 到 rt 内 容 的 指令 , 则 无 须 增加 新 的 周期 。 这 样 ,对 于 每 个 
R- 型 和 Branch 类 指令 的 执行 ,都 会 多 一 个 时 钟 周期 ,而 其 他 指令 的 时 钟 周期 数 不 变 。 

(3) 在 原来 的 译 码 / 取 数 周期 中 先 读 rt 到 B, 这 样 ,对 于 R- 型 指令 、Branch 类 指令 、 
load/store 类 指令 和 Ori 指令 等 都 要 再 增加 一 个 周期 用 于 读 rs 到 A。 

显然 ,上 述 三 种 方式 中 ,第 (2) 种 做 法 得 到 的 综合 CPI 最 小 。 

16. 某 高 级 语言 源 程序 中 的 一 个 while 语句 为 “while(save[ 让 二 二 k)i 十 二 1;”, 若 对 其 
编译 时 ,编译 器 将 i 和 分 别 分 配 在 寄存 器 $s3 和 $s5 中 ,数组 save 的 基 址 存放 在 $s6 中 ， 
则 生成 的 MIPS 汇编 代码 段 如 下 : 
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1 loop: sll $tl, $s3,2 #R[$t1]<R[$s3]<<2,B 即 RI$t1]=iX4 

2 add $tl, $tl, $s6 #R[$t1]<R[$t1]+R[$s6], 妈 RI$t1]=Address of 
#save [i] 

3 1w $t0, 0($t1) #R[$t0]<M[R[$t1]+0], 即 RI$t0]=save[il] 

4 bne $t0, $s5, exit 4#ifR[St0] 天 R[$s5] then goto exit 

5 addi $s3, $s3,1 #R[$s3]<R[$s3]+1, 即 i=i+1 

6 j loop #goto loop 

7 exit: 


假定 如 图 5. 4 所 示 的 单 周期 数据 通路 和 如 图 5. 6 所 示 的 多 周期 数据 通路 中 各 主要 功能 
单元 的 操作 时 间 为 : 存储 器 一 200ps,ALU 和 加 法 器 一 100ps, 寄 存 器 堆 ( 读 或 写 ) 一 50ps。 
在 不 考虑 多 路 选择 器 、 控 制 单元 .PC 扩展 器 和 线路 等 延迟 的 情况 下 , 单 周期 和 多 周期 处 理 
器 的 时 钟 周期 至 少 各 为 多 少 ? 若 上 述 程序 段 共 循环 执行 8 次 , 则 在 单 周期 数据 通路 和 多 周 
期 数据 通路 中 执行 各 需要 多 少 纳 秒 ? 

【分 析 解 答 】 

单 周 期 处 理 器 的 时 钟 周期 至 少 为 200 十 50 十 100 十 200 十 50 二 600ps; 多 周期 处 理 器 的 时 
钟 周期 至 少 为 200ps。 对 于 单 周 期 数据 通路 中 的 8 次 循环 执行 ,第 1~4 条 指令 执行 了 8 次 ， 
第 5~6 条 指令 执行 了 7 次 ,因此 ,共用 了 (4X8 十 2X7)X600==27600ps 二 27. 6ns。 对 于 多 
周期 数据 通路 中 的 8 次 循环 执行 ,sll.add 和 addi 指令 都 需要 4 个 时 钟 周期 ,bne 和 j 指令 需 
要 3 个 时 钟 周期 ,lw 指令 需要 5 个 时 钟 周期 ,因此 ,一 共用 了 (4 十 4 十 5 十 3) X8X200 十 (4 十 
3) X7X200 一 35400ps 一 35. 4ns。 

17. 时 钟 周期 和 CPI 这 两 个 重要 参数 对 处 理 器 性 能 起 非常 关键 的 作用 ,因而 在 处 理 器 
设计 中 需要 对 这 两 个 参数 进行 权衡 。 有 些 设计 者 偏向 以 增 大 CPI 为 代价 换取 较 高 的 主 频 ， 
而 另外 一 些 设计 者 则 偏向 以 较 低 主 频 换取 CPI 值 的 降低 。 在 不 同 指导 思想 下 设计 出 以 下 
两 种 不 同 的 处 理 器 M1 和 M2。 

M1: 多 周期 处 理 器 ,数据 通路 结构 类 似 图 5. 6, 所 不 同 的 是 , 它 将 写 寄存 器 与 存储 器 读 
或 ALU 计算 合 在 同一 个 时 钟 周 期 内 进行 , 主 频 为 300MHz。 

M2: 多 周期 处 理 器 ,数据 通路 结构 类 似 M1, 所 不 同 的 是 , 它 进一步 将 有 效 地 址 计算 和 
存储 器 操作 合 在 同一 个 时 钟 周 期 内 进行 ,因而 延长 了 一 个 节拍 内 的 关键 路 径 , 主 频 降低 
为 250MHz。 

已 知 基 准 程序 CPUint 2000 中 各 类 指令 的 频率 为 : l0ad 一 25% ,store 一 10% ,branch 一 
11% ,jump 一 2%,ALU 一 52%。 以 基准 程序 CPUint 2000 为 标准 ,比较 两 种 不 同 处 理 器 的 
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性 能 ,说 明 哪个 处 理 器 性 能 更 好 。 找 到 一 种 指令 序列 组 合 , 使 得 用 它 来 评测 时 某 个 处 理 器 性 
能 明显 比 另 一 个 高 。 

【分 析 解 答 】 

参考 图 5. 6 所 对 应 的 有 限 状态 转换 图 5. 7, 对 M1 和 M2 进行 分 析 , 得 到 如 下 结果 : 
load store .branch jump 和 ALU 五 类 指令 在 M1 中 的 CPI 分 别 为 4.4、3、3、3, 在 M2 中 的 
CPI 分 别 为 3.3、3、3、3。 因 此 ,M1 和 M2 的 综合 CPI 分 别 如 下 : 

CPIC(M1) = 25% X 4 二 +10% X411%X3+2% X3+52%X3= 3.35 
CPI(M2) = 25% X310% X3 二 11% X3++2%X3 二 +52%X3=3 

因此 ,M1 和 M2 的 MIPS 数 分 别 为 : 

MIPS(M1)=300/3. 35289. 55 

MIPSCM2) 一 250/383. 33 

M1 和 M2 分 别 对 图 5. 6 所 示 的 数据 通路 作 了 不 同 的 改变 ,显然 ,M1 的 做 法 效果 更 好 。 
但 当 所 有 指令 都 是 load/store 指令 时 ,M2 的 CPI 还 是 3, 但 M1 的 CPI 变 为 4, 其 MIPS 数 
为 300/4=75。 显 然 , 这 种 情况 下 M2 的 性 能 比 M1 高 。 

18. 对 于 多 周期 MIPS 处 理 器 , 若 将 数据 访问 过 程 分 成 两 个 时 钟 周期 , 则 可 使 时 钟 频率 
从 480MHz 提高 到 560MHz, 但 会 增加 lw 和 sw 指令 的 时 钟 周期 数 。 已 知 基准 程序 
CPUint 2000 中 各 类 指令 的 频率 为 : load 一 25%，, store 一 10% ,branch 一 11% ,jump 一 2%%， 
ALU 一 52%。 若 以 基准 程序 CPUint 2000 为 标准 , 则 时 钟 频率 提高 后 处 理 器 的 性 能 提高 了 
多 少 ? 若 将 取 指 令 过 程 再 分 成 两 个 时 钟 周期 , 则 可 进一步 使 时 钟 频率 提高 到 640MHz, 此 
时 ,时 钟 频 率 的 提高 是 否 也 能 带 来 处 理 器 性 能 的 提高 ? 为 什么 ? 

【分 析 解 答 】 

假设 MI .M2 和 M3 分 别 表示 时 钟 频率 为 480MHz、560MHz 和 640MHz 的 多 周期 处 
理 器 ,对 如 图 5.7 所 示 的 有 限 状 态 转换 图 进行 分 析 得 知 ，load ,store branch jump 和 ALU 
类 指令 在 Ml 中 的 CPI 分 别 为 5.4、3、3、4, 在 M2 中 的 CPI 分别 为 6.5.3、3、4, 在 M3 中 的 
CPI 分 别 为 7.6、4、4、5。 因 此 ,用 基准 程序 CPUint 2000 来 计算 ,得 到 它们 的 综合 CPI 分 别 
如 下 : 





CPI(M1)=25% X5+10%X4+11%X3+2% X3+52% X4=4.12 
CPI(M2)=25% X6+10%X5+11%X3+2%X3+52%X4=4.47 
CPI(M3)=25% X7+10%X6+11%X4+2%X4+52%X5=5.47 
因此 ,M1、M2 和 M3 的 MIPS 数 分 别 如 下 : 
MIPS(M1)=480/4. 12s*116.5 
MIPS(M2)=560/4. 472125. 3 
MIPS(M3)=640/5.47X117 
由 此 可 见 , 数 据 访问 改 为 双 周 期 的 做 法 效果 较 好 。 进 一 步 把 取 指 令 改 为 双 周 期 的 做 法 
反而 使 MIPS 数 变 小 了 ,因此 ,这 种 做 法 不 可 取 。 因 为 数据 访问 只 涉及 load/store 指令 ,而 
取 指 令 则 涉及 所 有 指令 ,使 得 CPI 显著 增 大 ,从 而 降低 了 性 能 。 
19. 假定 有 一 条 MIPS 伪 指 令 “bemp $tl，$t2，$t3”, 其 功能 是 实现 对 两 个 主 存 块 数 
据 的 比较 ,$tl 和 $t2 中 分 别 存放 两 个 主 存 块 的 首 地 址 , $t3 中 存放 数据 块 的 长 度 ,每 个 数 
据 占 一 个 字 (4B) , 若 所 有 数据 都 相等 , 则 将 0 置 入 $tl; 和 否则 ,将 第 一 次 出 现 不 相等 时 的 地 址 








中 央 处 理 器 


分 别 置信 $tl 和 $t2 并 结束 比较 。 

(1) 若 $tt 和 $t5 是 两 个 空闲 寄存 器 ,请 给 出 实现 该 伪 指令 的 指令 序列 。 

(2) 假定 比较 的 数据 块 大 小 为 50 个 字 , 说 明 在 类 似 于 图 5. 6 所 示 的 多 周期 数据 通路 中 
执行 该 伪 指令 时 最 多 需要 多 少 个 时 钟 周期 。 


【分 析 解 答 】 
(1) 实现 伪 指 令 “becmp $tl，$t2，$t3” 的 指令 序列 如 下 : 
beq  $t3, $zero, done # 车 数据 块 长 度 为 0, 则 结束 
compare: lw $t4, 0($t1) # 殷 1 的 当前 数据 取 到 $t4 
lw $t5, 0($t2) # 块 2 的 当前 数据 取 到 $t5 
bne 。 $t4，$t5，done #St4 和 $t5 的 内 容 不 等 , 则 结束 
addi S$tl, $tl, 4 # 块 1 中 的 当前 数据 指向 下 一 个 
addi $t2, $t2,4 # 块 2 中 的 当前 数据 指向 下 一 个 
addi S$t3, $t3, -1 # 比 较 次 数 减 1 
bne $t3, $zero, compare # 车 没有 全 部 比较 完 , 则 继续 比较 
addi $tl, $zero, 0 # 阁 全 部 都 相等 , 则 将 $t1l 置 0 


done: 


(2) 在 类 似 图 5.6 所 示 的 多 周期 数据 通路 中 执行 时 ,上 述 程序 段 中 用 到 的 指令 beq lw、 
bne 和 addi 的 时 钟 周期 数 分 别 为 3.5、3 和 4。 若 比较 的 数据 块 大 小 为 50 个 字 , 则 上 述 指令 
序列 中 的 循环 最 多 被 执行 50 次 ,因而 所 需 的 指令 数 最 多 为 1 十 50X7 十 1=352。 其 中 ,load 
指令 为 50X2=100 条 ,时 钟 周期 数 为 5X100 王 500;branch 指令 数 为 1 十 2X50=101, 时 钟 
周期 数 为 3X101=303;addi 指令 数 为 1 十 3X50=151, 时 钟 周期 数 为 4X151==604。 所 以 ， 
总 时 钟 周期 数 最 多 为 500 十 303 十 604 二 1407。 

20. 在 一 个 指令 集中 增添 功能 强大 的 复杂 指令 时 ,通常 使 用 微 程序 方式 对 这 些 复杂 指 
令 进行 控制 。 如 果 要 求 在 图 5. 6 所 示 的 多 周期 数据 通路 中 采用 微 程序 控制 方式 实现 第 
19 题 中 的 bemp 指令 ,并 且 规 定 使 用 通用 寄存 器 作为 两 个 额外 临时 寄存 器 rtl 和 rt2, 即 指 
令 的 汇编 形式 为 “bcmp rs, rt, rd, rtl, rt2”。 

(1) 请 给 出 全 套 的 设计 方案 ,包括 该 指令 的 机 器 码 格式 (与 原 有 指令 格式 兼容 ) ,指令 执 
行 流程 (用 RTL 表示 ) ,数据 通路 修改 方案 ,控制 信号 增加 或 修改 方案 、 指 令 执 行 对 应 的 有 
限 状 态 机 等 。 

(2) 与 第 19 题 的 软件 实现 方式 相 比 ,该 指令 用 硬件 实现 时 的 速度 快 了 多 少 ? 硬件 实现 
速度 快 的 原因 是 什么 ? 

(3) 能 否 用 单 周 期 数据 通路 实现 ?车 能 , 则 用 软件 实现 合算 还 是 用 硬件 实现 合算 ? 

(4) 如 果 rtl 和 rt2 不 用 通用 寄存 器 ,而 是 用 内 部 寄存 器 , 则 会 有 哪些 好 处 ? 

【分 析 解 答 】 

(1) 该 指令 的 汇编 形式 为 : bemp rs, rt, rd, rtl, rt2。 

指令 的 机 器 码 格式 如 下 。 其 中 6 位 OP 字段 可 以 选择 一 个 未 被 其 他 指令 使 用 的 编码 。 

31 26 25 2120 161 1110 65 10 
OP rs It rd rtl rt2 0 





指令 的 功能 如 下 : 比较 个 数 由 rd 指出 ,如 果 rd 的 内 容 为 0 则 什么 都 不 做 ,继续 执行 下 


地 上 测 
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条 指令 ,否则 ,对 rs 和 rt 所 指 内 存单 元 的 数据 依次 比较 ,直到 发 生 以 下 情况 为 止 。@ 若 存在 

一 对 数据 不 相等 , 则 将 不 相等 的 数据 所 在 的 内 存单 元 地 址 分 别 保存 在 rs 和 rt 中 ,结束 执行 ; 

@ 若 所 有 数据 都 相等 , 则 将 0 存放 在 rs 中 ,结束 执行 。rtl 和 rt2 是 临时 寄存 器 ,在 指令 执行 

过 程 中 ,rs、rt、rd、rtl 和 rt2 都 会 被 破坏 。 
该 指令 执行 流程 如 图 5. 14 所 示 。 
对 图 5.6 所 示 的 数据 通路 和 控制 信号 做 以 下 


@ 在 存储 器 的 Adr 处 对 原 MUX 进行 修改 , 增 


加 RErsj( 在 A 中 ) 和 R[rtj( 在 B 中 ) 两 个 输入 , 原 
控制 信号 IorD 改 为 两 位 , 当 IorD 为 0.1.2 和 3 时 ， 
分 别 将 PC、ALUout、A 和 B 送 Adr 处 。 

@ 在 寄存 器 堆 的 Ra 处 增加 一 个 MUX, 除 原来 
的 rs 外 ,增加 rt\rd 和 rtl 三 个 输入 端 ,增加 相应 的 
两 位 控制 信号 RdAddl, 当 RdAddl 为 0.1.2 和 3 RS 一 REs]+4 REA] Rn]+4 


时 ,寄存 器 读 地 址 分 别 为 rs rt\rd 和 rtl 。 
@ 在 寄存 器 堆 的 Rb 处 增加 一 个 MUX, 除 原 


来 的 rt 外 , 另 一 个 输入 来 自 rt2 ,增加 相应 的 一 位 控 


制 信号 RdAdd2, 当 RdAdd2 为 0 和 1 时 ,寄存 器 读 > 
地 址 分 别 为 rt 和 rt2。 








R[rtl]-—M[R[rs]], RIrt2]—MIRI] 









































@ 在 寄存 器 堆 的 Rw 处 对 原 MUX 进行 修改 ， 2 
除了 原来 的 rt 和 td 外 ,增加 rs、rtl 和 rt2 三 个 输 二 
人 , 原 控制 信号 RegDst 改 为 3 位 , 当 RegDst 为 0、 
1.2、3、4 时 ,寄存 器 写 地 址 分 别 为 rs、rt、rd、rtl 图 5.14 指令 执行 流程 图 
和 rt2。 


@ 在 寄存 器 堆 的 Dw 处 对 原 MUX 进行 修改 ,除了 原来 的 输入 以 外 ,增加 一 个 输入 端 
0, 原 控制 信号 MemtoReg 改 为 两 位 , 当 MemtoReg 为 0.1 和 2 时 , 存 人 寄存 器 的 内 容 分 别 
为 存储 器 读 出 数据 、ALU 输出 结果 和 0。 

@ 在 ALU 的 B 输 入 端 处 对 原 MUX 进行 修改 ,再 增加 两 个 输入 0 和 1, 以 使 ALU 能 
执行 RErd] 一 0 和 R[rd] 一 1 的 操作 ,这 样 , 原 控制 信号 ALUSelB 改 为 3 位 ，ALUSelB 为 
0.1.2.3 时 ,原先 的 定义 不 变 ,ALUSelB 为 4 和 5 时 ,ALU 的 BB 输入 端 分 别 为 0 和 1。 

根据 该 指令 执行 流程 ,以 及 相应 数据 通路 和 控制 信号 的 定义 ,得 到 该 指令 执行 过 程 对 应 
的 状态 转换 图 ,如 图 5. 15 所 示 。 图 中 在 每 个 状态 内 仅 给 出 了 关键 控制 信号 的 取 值 ,并 省 略 
了 最 初 的 两 个 公共 状态 ( 取 指令 周期 和 译 码 / 取 数 周期 ) 以 及 其 他 指令 执行 的 状态 (参看 图 
5.7)。 该 指令 的 执行 从 第 12 状态 开始 ,每 个 状态 按 顺 序 编号 ,分 别 为 12 .13、… 25 。 

图 5.7 对 应 的 原 11 条 指令 的 有 限 状 态 机 已 有 12 个 状态 和 两 个 分 支点 。 加 上 该 指令 的 
三 个 分 支点 ,新 的 有 限 状态 机 中 有 5 个 分 支点 和 26 个 状态 , 需 用 5 位 表示 状态 号 ,如 果 用 微 
程序 设计 方式 实现 该 指令 的 控制 逻辑 ,每 个 状态 对 应 一 条 微 指令 ,那么 , 微 指令 地 址 应 该 有 
5 位 ,转移 控制 字段 BrCtr 的 位 数 为 3, 其 编码 及 含义 如 下 (Next paddr 为 下 条 微 指令 地 址 ) ; 

000 Next paddr=00000 
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图 5.15 指令 执行 的 有 限 状态 转换 图 


001 


Next paddr 二 ROM 1 中 对 指令 译 码 得 到 的 相应 入 口 地 址 
010 


Next paddr 二 ROM2 中 lw/sw 对 应 的 入口 地 址 

011 Next paddr 一 paddr 十 1 

100 Next paddr 一 该 指令 分 支 1 处 输出 的 地 址 

101 ”Next pnaddr 一 该 指令 分 支 2 处 输出 的 地 址 

110 ”Next paddr 一 该 指令 分 支 3 处 输出 的 地 址 

执行 到 该 指令 时 , 则 调 出 该 指令 对 应 的 微 程序 执行 。 该 指令 对 应 的 微 程序 是 从 第 12 状 
态 开始 的 微 指令 序列 。 其 中 的 三 个 分 支点 分 别 在 第 12、17 和 第 24 状态 ,都 是 根据 标志 ZF 
控制 分 支 的 。 对 于 第 12 状态 的 分 支 1, 若 ZF 二 1, 则 Next paddr 一 00000, 和 否则 Next 


击溃 
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Laddr 二 yaddr 十 1; 对 于 第 17 状态 的 分 支 2, 若 ZF 二 0, 则 Next paddr 二 00000, 否 则 Next 
paddr 二 paddr 十 1; 对 于 第 24 状态 的 分 支 3, 若 ZF 二 0, 则 Next paddr 王 01101 ,否则 Next 
paddr 二 paddr 十 1。 因 此 ,分 支 1 和 分 支 2 处 可 以 各 用 一 个 MUX 实现 ,根据 ZF 的 值 选 择 将 
00000 还 是 yaddr 十 1 输出 作为 Next paddr。 分 支 3 处 用 一 个 地 址 修改 逻辑 , 当 ZF=0 时 ， 
将 输入 11001 改 为 01101, 当 ZF=1 时 不 修改 。 

对 应 的 下 条 微 地 址 生成 逻辑 如 图 5. 16 所 示 ,在 此 假定 采用 计数 器 法 。 
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ZF 
图 5.16 题 20 中 的 下 条 微 地 址 生成 逻辑 


(2) 假定 bemp 指令 的 比较 次 数 为 n(n 去 0) ,根据 上 述 有 限 状 态 机 可 知 ,最 坏 情况 下 用 
硬件 实现 该 指令 所 需 的 时 钟 周期 数 为 2 十 1 十 12n 十 1 二 4 十 12n; 而 根据 第 19 题 给 定 的 指令 
序列 可 知 。 最 坏 情况 下 用 软件 实现 所 需 的 时 钟 周期 数 为 10n 十 3 十 6n 十 4 十 12n 二 7 十 28n。 
因此 ,硬件 实现 比 软件 实现 至 少 快 一 信和 多。 硬件 实现 比 软件 快 的 原因 主要 有 两 个 : 软件 
方式 下 ,指令 序列 中 的 每 条 指令 都 要 取 指令 、 译 码 / 取 数 ;而 硬件 实现 时 不 需要 。@ 软件 方 
式 下 ,每 条 指令 都 要 保存 结果 ,下 条 指令 用 时 再 取 ; 而 硬件 方式 下 ,中 间 数 据 可 以 直接 使 用 ， 
无 须 先 存 后 取 。 

(3) 因为 本 指令 在 执行 过 程 中 可 能 需要 多 次 写 寄存 器 ,因此 ,不 能 用 单 周 期 数据 通路 实 
现 。 假 设 能 用 的 话 ,因为 单 周期 数据 通路 的 时 钟 周期 以 最 复杂 指令 为 准 , 因 此 ,这 个 复杂 指 
令 会 大 大 延长 时 钟 周期 ,此 时 ,用 软件 实现 更 合算 。 

(4) 如 果 rtl 和 rt2 不 用 在 指令 中 明显 给 出 , 即 不 用 通用 寄存 器 而 改 用 内 部 寄存 器 的 
话 , 则 可 大 大 简化 数据 通路 ,减少 控制 信号 和 时 钟 周 期 数 ,并 且 可 减少 被 该 指令 破坏 的 通用 
寄存 器 的 个 数 。 但 是 ,因为 要 额外 增加 专用 的 内 部 临时 寄存 器 ,其 硬件 成 本 会 更 高 。 

21. 假设 微 程序 控制 器 容量 为 1024 X48 位 , 微 程序 可 在 整个 控 存 内 实现 转移 ,反映 所 
有 指令 执行 状态 转换 的 有 限 状 态 机 中 有 4 个 分 支点 ,采用 水 平 型 微 指令 格式 ,并 采用 断定 法 


史 天 处 理 器 


确定 下 条 微 地 址 , 即 由 专门 的 下 地 址 字段 确 定 微 地 址 。 请 设计 微 指令 的 格式 ,说 明 各 字段 的 
含义 和 位 数 ,并 对 转移 控制 字段 进行 编码 。 

【分 析 解 答 】 

微 程序 控制 器 容量 为 1024X48 位 ,说 明 微 地 址 占 10 位 , 微 指令 字 为 48 位 。 微 指令 字 
分 三 个 字段 : 微 命令 字段 转移 控制 字段 和 下 地 址 字段 。 因 为 微 地 址 占 10 位 ,所 以 下 地 址 
字段 有 10 位 ,用 来 给 出 下 条 微 指令 的 地 址 ;因为 需要 对 5 种 情况 进行 控制 ,所 以 转移 控制 字 
段 有 3 位 ; 剩 下 的 48 一 10 一 3 二 35 位 是 微 命令 ( 微 操作 码 ) 字 段 ,用 于 对 微 命令 进行 编码 。 

采用 断定 法 时 ,转移 控制 字段 可 按 以 下 方案 进行 编码 。 

000: 下 地 址 字段 指 出 的 地 址 作为 下 条 微 地址 。 

100: 根据 分 支 1 处 的 条 件 来 选择 下 条 微 地 址 。 

101: 根据 分 支 2 处 的 条 件 来 选择 下 条 微 地 址 。 

110: 根据 分 支 3 处 的 条 件 来 选择 下 条 微 地 址 。 

111: 根据 分 支 4 处 的 条 件 来 选择 下 条 微 地 址 。 

如 果 采 用 计数 器 法 , 则 转移 控制 字段 需要 对 6 种 情况 进行 控制 ,在 上 述 5 种 情况 的 基础 
上 再 加 上 “顺序 执行 下 条 微 指令 ”的 情况 ,其 中 第 一 种 情况 改 为 * 取 指 微 程序 首 地 址 作为 下 条 
微 地 址 ”。 此 时 ,转移 控制 字段 也 只 要 3 位 编码 。 

综 上 所 述 , 微 指令 的 格式 如 下 : 

47 13 12 10 9 0 
| 向 命令 字段 转移 控制 字段 | 。 下 地 址 字段 ] 


22. 对 于 多 周期 CPU 的 异常 和 中 断 处 理 , 回 答 以 下 问题 : 

(1) 对 于 除数 为 0、 洲 出 、 无 效 指令 操作 码 无 效 指令 地 址 .无效 数据 地 址 \ 缺 页 .访问 越 
权 和 外 部 中 断 ,CPU 在 哪些 指令 的 哪个 时 钟 周期 能 分 别 检测 到 这 些 异常 或 中 断 ? 

(2) 在 检测 到 某 个 异常 或 中 断后 ,CPU 通常 要 完成 哪些 工作 ? 简要 说 明 CPU 如 何 完 
成 这 些 工作 。 

【分 析 解 答 】 

(1) 多 周期 CPU 中 不 同 指令 执行 时 可 能 会 发 生 不 同 的 异常 事件 ,这 些 异常 事件 发 生 在 
不 同 的 时 钟 周期 内 ,CPU 在 不 同 的 时 钟 周 期 中 检测 不 同 的 异常 事件 。 

中 “除数 为 0 异常 在 取 数 / 译 码 周期 进行 检测 。 

加 “溢出 "异常 在 R- 型 指令 和 工 型 运算 类 指令 的 执行 周期 进行 检测 。 

加 “无 效 指令 操作 码 ” 异 常 在 取 数 / 译 码 周期 进行 检测 。 

@ “无 效 指令 地 址 “ 缺 页 ”和 “访问 越权 ”异常 在 取 指令 周期 检测 。 

@ “无 效 数据 地 址 “ 缺 页 "和 “访问 越权 ”异常 在 存储 器 访问 周期 检测 。 

@“ 外 部 中 断 ” 可 在 每 条 指令 的 最 后 一 个 周期 进行 检测 。 

(2) CPU 检测 到 某 个 异常 或 中 断后 ,要 完成 的 工作 是 关中 断 、 保 护 断 点 和 程序 状态 、 识 
别 异常 事件 (或 中 断 源 ) 并 转 异 常 ( 或 中 断 ) 处 理 。CPU 计算 断 点 值 并 将 断 点 和 程序 状态 字 
寄存 器 信息 送 到 栈 或 特定 的 寄存 器 中 ;异常 的 识别 大 多 采用 软件 识别 方式 ,而 外 部 中 断 则 可 
以 采用 软件 识别 或 硬件 识别 方式 ,然后 转 到 相应 的 处 理 程序 。 
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指令 流水 线 


6.1 教学 目标 和 内 容 安排 


主要 教学 目标 : 使 学 生 深 刻 理解 现代 计算 机 的 CPU 是 如 何 执行 指令 的 ,包括 指令 流水 
线 基本 原理 \ 流 水 段 寄 存 器 的 概念 ,流水 线 数据 通路 的 设计 、 流 水 线 的 控制 信号 、 结 构 冒 险 及 
其 处 理 ,数据 冒险 及 其 处 理 转 发 技术 控制 冒险 及 其 处 理 \ 分 支 预测 原理 ,超标 量 和 动态 流 
水 线 的 概念 ;并 让 学 生 初步 了 解 在 指令 流水 线 中 如 何 处 理 异常 和 中 断 , 以 及 各 种 存储 器 访问 
缺失 对 指令 流水 线 的 影响 。 

基本 学 习 要 求 ， 

(1) 理解 指令 流水 线 的 一 般 概念 。 

(2) 了 解 适合 流水 线 执行 的 指令 集 特征 。 

(3) 掌握 流水 线 数据 通路 的 设计 方法 。 

(4) 了 解 流水 线 控制 器 的 设计 原理 。 

(5) 理解 流水 线 冒 险 的 基本 概念 。 

(6) 了 解 结构 冒险 的 概念 和 处 理 策 略 。 

(7) 了 解数 据 冒 险 (数据 相关 ) 的 概念 。 

(8) 了 解 运 用 转发 技术 解决 数据 冒险 的 基本 原理 。 

(9) 了 解 load-use 数据 冒险 的 概念 和 处 理 策略 。 

(10) 了 解 控制 冒险 的 概念 和 引起 控制 冒险 的 几 种 原因 。 

(11) 了 解 静态 分 支 预测 和 动态 分 支 预 测 的 基本 原理 。 

(12) 了 解 异常 和 中 断 对 流水 线 的 影响 。 

(13) 了 解 访 存 缺 失 对 流水 线 的 影响 。 

(14) 了 解 超 流水 线 、 超 标量 和 动态 流水 线 等 高 级 流水 线 的 基本 概念 及 其 基本 实现 
技术 。 

现代 计算 机 都 采用 流水 线 方式 执行 指令 ,因此 ,有 关 指 令 的 流水 线 执行 方式 和 流水 线 处 
理 器 的 实现 等 内 容 是 非常 重要 的 。 主 教材 依照 “总 线 式 CPU 一 单 周期 CPU 一 多 周期 
CPU 一 基本 流水 线 CPU 王 动态 超标 量 超 流 水 线 CPU” 的 次 序 , 循 序 渐进 地 介绍 了 CPU 设 
计 技 术 及 其 发 展 过 程 。 实 际 上 前 面 介 绍 的 总 线 式 CPU、 单 周期 CPU 和 多 周期 CPU 等 非 流 
水 线 CPU 设计 的 内 容 都 是 为 后 面 介绍 流水 线 CPU 设计 做 铺垫 的 ,因为 真正 需要 学 生 掌 握 


的 应 该 是 反映 现实 的 流水 线 处 理 器 的 实现 技术 。 

主教 材 主要 从 流水 线 概述 流水线 处 理 器 的 实现 、 流 水 线 冒 险 及 其 处 理 和 高 级 流水 线 技 
术 4 个 方面 对 流水 线 技术 进行 了 介绍 。 

对 于 流水 线 概述 部 分 ,因为 其 内 容 比较 简单 ,所 以 ,只 要 通过 对 一 个 简单 例子 的 讲解 ,让 
学 生 明 白 采 用 流水 线 方式 执行 指令 的 基本 思想 ,以 及 采用 流水 线 后 指令 的 吞吐 率 与 指令 执 
行 时 间 的 变化 即 可 。 

对 于 流水 线 处 理 器 的 实现 ,以 具有 代表 性 的 11 条 MIPS 指令 为 实现 目标 ,分 析 每 条 指 
令 的 功能 和 执行 过 程 , 找 出 最 复杂 指令 所 需要 的 执行 阶段 。 在 介绍 流水 线 数据 通路 设计 时 ， 
可 以 对 照 前 面 的 单 周 期 数据 通路 设计 思路 ,对 两 者 进行 比较 ,以 使 学 生 有 一 个 从 简单 到 复杂 
的 认识 过 程 ,有 利于 学 生 对 流水 线 设计 和 实现 的 基本 方法 的 掌握 。 课 时 有 限 的 情况 下 ,可 以 
只 对 部 分 指令 在 流水 线 中 的 执行 过 程 进行 讲述 。 对 于 流水 线 CPU 中 控制 器 的 设计 ,只 要 
把 控制 信号 在 流水 段 寄 存 器 中 的 传送 过 程 说 明 清楚 ,再 说 明 清楚 流水 线 CPU 中 控制 器 设 
计 方式 与 单 周期 CPU 中 控制 器 设计 方式 是 一 样 的 就 可 以 了 。 

对 于 流水 线 冒 险 及 其 处 理 , 结 构 冒 险 ,数据 冒险 和 控制 冒险 三 种 基本 流水 线 冒 险 的 含义 
和 相应 的 冒险 处 理 原理 (例如 ,加 nop 指令 ,转发 ,阻塞 ,分支 预测 等 ), 可 以 通过 具体 的 指令 
序列 在 流水 线 数据 通路 中 的 执行 过 程 来 讲解 ,使 学 生 具 有 对 具体 问题 进行 相应 分 析 的 能 力 。 
课时 有 限 的 情况 下 ,对 于 一 些 具体 的 实现 细节 可 以 跳 过 ,如 具体 的 转发 线路 、 带 转发 控制 的 
流水 线 数据 通路 ,load-use 数据 冒险 的 检测 和 处 理 、 分 支 预测 的 具体 实现 .异常 或 中 断 引起 
的 控制 冒险 的 具体 处 理 、 访 问 缺 失 引起 的 流水 线 阻塞 处 理 等 。 虽 然 , 上 述 内 容 的 具体 实现 在 
课时 不 够 时 可 以 不 讲 , 但 是 ,对 于 这 些 内 容 所 涉及 的 基本 概念 和 基本 原理 ,学 生还 是 应 该 有 
一 定 程度 的 了 解 ,因为 这 些 内 容 对 学 生 全 面 了 解 指令 执行 过 程 中 数据 的 流动 过 程 以 及 全 面 
掌握 现代 计算 机 处 理 器 设计 技术 是 必需 的 。 

对 于 高 级 流水 线 技术 ,基本 要 求 是 能 够 了 解 超 流水 线 ,超标 量 和 动态 流水 线 等 高 级 流水 
线 的 基本 概念 及 其 基本 实现 技术 。 在 课时 有 限 的 情况 下 ,课堂 中 只 要 简单 说 明 一 下 每 种 实 
现 技术 的 基本 思想 即 可 ,具体 的 实现 实例 和 详细 的 描述 部 分 可 以 跳 过 。 


6.2 主要 内 容 提要 


1. 指令 流水 线 的 设计 和 实现 

指令 流水 线 设计 的 基本 思想 是 ,将 每 条 指令 的 执行 规整 化 为 若干 个 同样 的 流水 阶段 ,每 
个 流水 阶段 的 执行 时 间 一 样 , 都 等 于 一 个 时 钟 周期 。 采 用 流水 线 方式 执行 指令 ,其 吞吐 率 比 
非 流水 线 方式 下 提高 了 若干 倍 ,但 是 ,对 于 每 一 条 指令 来 说 ,反而 比 非 流 水 线 方式 时 延长 了 
执行 时 间 。 

每 个 流水 段 中 的 部 件 都 是 一 组 组 合 逻 辑 加 上 一 组 寄存 器 ,组 合 邀 辑 中 产生 的 结果 在 时 
钟 到 来 时 被 存 到 寄存 器 (如 程序 计数 器 、 条 件 码 寄 存 器 ,流水 段 寄 存 器 ) 中 。 每 两 个 相 邻 流水 
段 之 间 的 流水 段 寄 存 器 用 以 记录 所 有 在 后 面 阶段 要 用 到 的 各 种 信息 ,例如 指令 代码 .参加 运 
算 的 操作 数 .指令 运算 结果 ,指令 异常 信息 ,寄存 器 读 口 地 址 .寄存 器 写 口 地 址 ,存储 单元 地 
址 ,新 的 PC 值 等 。 指 令 译 码 得 到 的 控制 信号 也 通过 流水 段 寄 存 器 传送 到 后 面 各 个 流水 
段 中 。 
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2. 指令 流水 线 的 局 限 性 

理想 情况 下 ,每 个 时 钟 到 来 ,都 有 一 条 指令 进入 流水 线 , 也 有 一 条 指令 执行 结束 。 但 是 ， 
很 多 因素 会 导致 指令 流水 线 的 情况 不 很 理想 。 首 先 ,并 不 是 每 条 指令 都 有 相同 多 个 流水 段 ， 
也 不 是 每 个 流水 段 的 执行 都 需要 一 样 长 的 时 间 , 因 此 ,为 了 能 够 方便 地 控制 指令 流水 线 的 执 
行 ,通常 以 最 复杂 的 指令 所 需 阶段 数 来 确定 流水 段 个 数 , 并 以 最 复杂 阶段 所 需 时 间 为 基准 来 
设计 时 钟 周期 ;其 次 , 随 着 流水 线 深度 的 增加 ,流水 段 寄 存 器 的 读 写 所 带 来 的 额外 开销 比例 
也 增 大 ;最 后 ,指令 执行 时 ,还 会 发 生 资源 冲突 数据 相关 、 控 制 相关 cache 缺失 等 问题 , 导 
致 流水 线 被 阻塞 而 延长 程序 执行 时 间 。 

3. 流水 线 数据 通路 设计 举例 

以 下 以 MIPS 处 理 器 为 例 ,概要 说 明 流水 线 数据 通路 的 实现 原理 。 与 第 5 章 中 单 周期 
数据 通路 和 多 周期 数据 通路 的 实现 目标 一 样 ,流水 线 数据 通路 的 实现 目标 也 是 表 5. 1 所 示 
的 11 条 MIPS 指令 。 根 据 对 这 11 条 指令 的 分 析 , 可 以 得 到 执行 这 11 条 指令 的 5 段 流水 线 
数据 通路 基本 框架 ,如 图 6. 1 所 示 。 
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图 6.1 五 段 流水 线 数据 通路 基本 框架 


在 图 6. 1 所 示 的 流水 线 数据 通路 中 ,每 条 指令 的 执行 都 经 历 5 个 流水 段 : IF .ID、Ex、 
Mem 和 Wr, 每 个 流水 段 都 在 不 同 的 功能 部 件 中 执行 。 流 水 段 之 间 有 一 个 流水 段 寄 存 器 , 例 
如 ,IF/ID 寄存 器 是 介 于 IF 段 和 ID 段 之 间 的 寄存 器 。 每 个 流水 段 寄 存 器 用 来 存放 从 当前 
流水 段 传 到 后 面 所 有 流水 段 的 信息 。 因 为 每 个 段 间 传递 的 信息 不 一 样 ,所 以 各 流水 段 寄 存 
器 的 长 度 也 不 一 样 。 

图 6.1 中 的 取 指令 部 件 IUnit 和 执行 部 件 ExecUnit 分 别 如 图 6.2 和 6. 3 所 示 。 

如 图 6. 2 所 示 的 取 指令 部 件 中 ,IM 为 指令 存储 器 ,取出 的 指令 被 送 到 IF/ID 流水 段 寄 
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6.3 执行 部 件 ExecUnit 的 实现 


存 器 的 输入 端 ,在 下 个 时 钟 到 来 后 开始 写 入 。 在 取 指令 的 同时 ,计算 PC 十 4, 得 到 的 值 被 送 
到 PC 的 输入 端 ,在 下 个 时 钟 到 来 后 开始 写 人 PC。 

不 同 的 指令 在 不 同 的 控制 信号 控制 下 在 执行 部 件 中 执行 不 同 的 操作 。 

4. 流水 线 冒 险 的 检测 与 处 理 

指令 流水 线 中 ,可 能 会 遇 到 一 些 情况 使 得 流水 线 无 法 正确 执行 后 续 指令 ,而 引起 流水 线 
阻塞 (停顿 )。 这 种 现象 称 为 流水 线 冒 险 。 根 据 导致 冒险 的 原因 的 不 同 , 分 为 结构 冒险 ,数据 
冒险 和 控制 冒险 三 种 。 

结构 冒险 也 称 资源 冲突 ,由 多 条 指令 同时 竞 用 同一 个 功能 部 件 引 起 。 所 用 的 解决 策略 
包括 : 中 规定 每 个 功能 部 件 在 一 条 指令 中 只 能 被 用 一 次 ; 加 规定 每 个 功能 部 件 只 能 在 某 个 
特定 的 阶段 被 用 ; @ 将 指令 存储 器 (如 Code Cache) 和 数据 存储 器 (如 Data Cache) 分 开 。 

数据 冒险 也 称 数 据 相 关 。 当 前 面 指令 的 执行 结果 是 后 面 指令 的 操作 数 时 ,可 能 会 发 生 
数据 冒险 。 所 用 解决 策略 有 软件 和 硬件 两 种 方式 。 


击溃 
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(1) 软件 方式 。 编 译 器 在 发 生 数据 相关 的 指令 之 间 插 入 足够 的 nop 指令 ,这 种 方式 下 ， 
CPU 执行 程序 时 便 不 会 发 生 数 据 冒 险 现象 ,软件 方式 简化 了 硬件 实现 ,但 是 ,软件 方式 会 同 
时 增加 程序 的 空间 开销 和 时 间 开销 。 

(2) 硬件 方式 。 有 两 种 硬件 解决 方式 ,一 种 是 单纯 采用 “阻塞 "技术, 另 一 种 是 采用 “ 转 
发 十 阻塞 ”技术 。 在 图 6. 1 中 加 上 转发 检测 及 处 理 .load-use 冒险 检测 及 处 理 机制 后 ,就 可 
以 解决 数据 冒险 问题 。 采 用 “转发 十 阻塞 "技术 的 部 分 流水 线 数据 通路 如 图 6.4 所 示 。 
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6.4 带 转发 和 load-use 冒险 处 理 的 部 分 流水 线 数据 通路 
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CPU 在 执行 程序 过 程 中 ,动态 检测 是 否 存在 数据 相关 ,在 存在 数据 相关 的 情况 下 ,通过 
转发 ( 旁 路 ) 技 术 将 前 面 指令 执行 过 程 中 得 到 的 结果 直接 传送 到 后 面 指令 执行 时 需要 操作 数 
的 地 方 ,对 于 像 load-use 这 样 不 能 通过 转发 解决 的 数据 冒险 , 则 在 指令 的 特定 流水 段 插入 
“气泡 ”以 “阻塞 "指令 继续 执行 ,直到 后 面 指令 能 够 取得 所 需 数据 为 止 。 单纯 采用 硬件 “ 阻 
塞 "的 方式 ,使 得 程序 的 空间 开销 比 软件 方式 好 ,但 时 间 开销 并 没有 减少 ,而 采用 ”转发 十 阻 
塞 ”的 方式 可 同时 减少 空间 开销 和 时 间 开 和 销 。 

控制 冒险 也 称 控制 相关 。 当 返回 指令 ,分 支 指令 、 跳 转 指令 等 有 可 能 改变 顺序 增 量 的 
PC 值 时 ,由 于 获取 转移 目标 地 址 的 时 间 较 长 ,使 得 在 目标 地 址 产生 前 已 经 有 指令 被 取 到 流 
水 线 中 ,如 果 已 经 取出 执行 的 指令 不 是 应 该 执行 的 指令 , 则 发 生 了 控制 冒险 。 所 用 解决 策略 
也 分 为 软件 方式 和 硬件 方式 。 

(1) 软件 方式 。 有 两 种 软件 方式 ,一 种 是 编译 器 简单 地 在 分 支 指令 、 跳 转 指 令 等 引起 控 
制 相 关 的 指令 后 面 插 入 足够 的 nop 指令 ; 另 一 种 是 分 支 延迟 调度 技术 ,编译 器 将 前 面 若干 
条 与 分 支 指令 等 无 关 的 指令 调 到 后 面 填充 到 延迟 槽 中 ,不 够 填 满 延迟 槽 时 ,用 nop 指令 补 
足 。 不 同 指令 的 延迟 槽 ( 即 延迟 损失 时 间 片 ) 不 同 , 它 与 该 指令 能 在 几 个 周期 内 得 到 正确 的 
PC 值 有 关 。 在 软件 进行 了 这 些 处 理 后 ,流水 线 执行 时 就 不 会 发 生 控制 冒险 现象 。 

(2) 硬件 方式 。 在 分 支 指令 . 跳 转 指令 等 引起 控制 相关 的 指令 后 面 插入 “气泡 ,使 流水 


指令 流 水 线 


线 停顿 若干 时 钟 ,直到 得 到 正确 的 PC 值 为 止 。 

对 于 分 支 指令 引起 的 控制 冒险 , 若 用 硬件 方式 处 理 , 则 通常 在 上 述 硬件 处 理 的 基础 上 ， 
还 会 采用 “分 支 预 测 ” 技 术 。 有 静态 预测 和 动态 预测 两 种 技术 ,静态 预测 与 分 支 指令 执行 的 
历史 情况 无 关 , 可 以 预测 总 是 条 件 满足 (taken) 而 转移 ,也 可 以 预测 总 是 条 件 不 满足 (not 
taken) 而 顺序 执行 ;动态 预测 利用 分 支 指令 执行 的 历史 情况 来 进行 预测 ,并 根据 实际 执行 情 
况 动 态 调整 。 可 采用 一 位 预测 两 位 预测 甚至 三 位 预测 技术 ,动态 预测 能 达到 90% 的 成 功 
率 。 不 管 采用 哪 种 分 支 预 测 技术 ,只 要 预测 失败 ,都 必须 将 错误 执行 的 指令 从 流水 线 中 冲 
刷 掉 。 

除了 上 述 几 种 流水 线 冒 险 之 外 ,异常 和 中 断 的 发 生 、cache 缺失 、TLB 缺失 等 也 都 会 引 
起 流水 线 阻塞 。 对 于 异常 和 中 断 引起 的 冒险 ,其 处 理 方式 与 分 支 预测 错误 时 的 处 理 类 似 。 
对 于 cache 缺失 引起 的 冒险 , 则 无 需 冲刷 指令 ,只 要 冻结 机 器 状态 若干 个 时 钟 周期 即 可 。 对 
于 TLB 缺失 , 则 可 以 像 缺 页 一 样 作为 一 种 内 部 异常 来 处 理 ,也 可 以 像 cache 缺失 一 样 完全 
由 硬件 处 理 。 关 于 cache 缺失 和 TLB 缺失 等 内 容 将 在 第 7 章 介绍 。 

5. 高 级 流水 线 技术 

高 级 流水 线 技术 充分 利用 指令 级 并 行 来 提高 流水 线 执行 的 性 能 。 有 两 种 增加 指令 级 并 
行 的 策略 。 一 种 是 超 流水 线 技术 , 它 通 过 增加 流水 线 的 级 数 (将 流水 线 划 分 成 更 多 的 流水 
段 ) 来 使 更 多 的 指令 同时 在 流水 线 中 重生 执行 ; 另 一 种 是 多 发 射流 水 线 技术 ,通过 同时 启动 
多 条 指令 独立 运行 来 提高 指令 并 行 性 。 

采用 多 发 射 技术 的 处 理 器 称 为 超标 量 处 理 器 。 要 实现 多 发 射流 水 线 ,必须 完成 对 指令 
进行 打包 和 置 险 处 理 两 个 任务 ,指令 打包 是 指 将 能 并 行 处 理 的 多 条 指令 同时 发 射 到 发 射 模 
中 。 根 据 指 令 打包 任务 是 由 编译 器 静态 完成 还 是 由 处 理 器 动态 完成 ,可 将 多 发 射 技 术 分 为 
静态 多 发 射 和 动态 多 发 射 两 类 。 

静态 多 发 射 处 理 器 通过 编译 器 静态 推测 来 完成 指令 打包 和 冒险 处 理 任务 ,指令 打包 的 
结果 可 看 成 将 同时 发 射 的 多 条 指令 合并 到 一 个 长 指令 中 ,因此 ,也 称 之 为 超 长 指令 字 
(VLIW)。 动 态 多 发 射 处 理 器 在 指令 执行 时 由 处 理 器 硬件 进行 动态 流水 线 调度 来 完成 指令 
打包 和 冒险 处 理 任务 , 即 处 理 器 可 以 动态 地 将 后 面 的 一 些 无 关 指令 调 到 前 面 先 执行 。 动 态 
流水 线 调度 可 以 实现 * 按 序 发 射 , 按 序 完 成 光 按 序 发 射 , 无 序 完成 ?和 * 无 序 发 射 , 无 序 完 
成 ” 几 种 指令 执行 模式 。 
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6.3 基本 术语 解释 


指令 流水 线 (instruction pipelining) 

多 条 指令 重合 执行 的 一 种 指令 执行 方式 。 流 水 线 方式 下 ,一 条 指令 的 执行 过 程 被 分 成 
若干 个 操作 子 过 程 ( 也 称 为 “流水 段 ”) ,每 个 子 过 程 由 一 个 独立 的 功能 部 件 来 完成 。 在 同一 
条 流水 线 中 ,每 条 指令 所 包含 的 操作 子 过 程 个 数 必须 一 样 ,每 个 子 过 程 所 花 的 时 间 也 要 设计 
成 相同 。 因 此 ,一般 按 最 复杂 的 指令 来 设计 流水 段 个 数 ,以 最 复杂 的 子 过 程 来 设计 流水 段 的 
宽度 。 这 样 ,所 有 功能 部 件 可 以 同时 执行 不 同 指令 的 不 同 子 过 程 中 的 操作 , 即 第 i 十 1 条 指 
令 的 第 上 段 和 第 i 条 指令 的 第 上 十 1 段 同 时 执行 。 理 想 情 况 下 ,经 过 若干 周期 后 ,流水线 能 
在 每 个 周期 内 执行 完 一 条 指令 。 
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现代 计算 机 一 般 把 复杂 度 相近 的 指令 用 同一 条 流水 线 完 成 ,而 把 复杂 度 相差 很 大 的 指 
令 安排 在 不 同 的 流水 线 中 。 

流水 线 深 度 (pipeline depth) 

流水 段 的 个 数 称 为 流水 线 深度 或 流水 线 级 数 。 

令 吞 吐 量 (instruction throughput) 

单位 时 间 内 处 理 器 执行 指令 的 条 数 。 采 用 流水 线 指令 执行 方式 能 提高 指令 的 吞吐 率 ， 
但 不 能 缩短 每 条 指令 的 执行 时 间 。 

流水 段 寄存 器 (pipeline register) 

每 两 个 相 邻 的 流水 段 之 间 需 要 设置 一 个 流水 段 寄 存 器 ,用 来 存放 前 一 个 流水 段 中 产生 
的 并 需 传 输 到 其 后 所 有 流水 段 的 信息 ,包括 各 种 数据 (PC ,指令 .立即 数 、. 运 算 结 果 寄存 器 
号 等 ) 和 控制 信号 两 大 类 信息 。 每 个 流水 段 的 功能 不 一 样 ,所 需 传递 的 信息 也 不 同 , 因 此 各 
流水 段 寄 存 器 的 长 度 也 不 同 。 

流水 线 冒 险 (hazard) 

当 若 十 指令 都 已 进入 流水 线 开始 执行 后 ,如 果 其 中 某 些 后 续 指令 的 某 些 流水 段 任务 不 
能 按时 开始 执行 ( 若 执行 就 会 发 生 错误 ) , 则 说 明 流水 线 被 破坏 ,这 种 现象 称 为 流水 线 冒险 。 
有 三 种 流水 线 冒 险 : 结构 冒险 ,控制 冒险 ,数据 冒险 。 

结构 冒险 (structural hazard) 

在 指令 流水 线 中 ,同一 个 部 件 同 时 被 不 同 指令 所 使 用 的 现象 称 为 结构 冒险 ,也 称 为 资源 
冲突 (resource conflicts) 。 

控制 冒险 (control hazard) 

在 指令 流水 线 中 ,转移 指令 或 异常 等 情况 改变 了 程序 执行 的 流程 ,而 使 得 在 目标 地 址 产 
生前 已 被 取 到 流水 线 中 的 指令 无 效 的 现象 称 为 控制 冒险 ,也 称 为 分 支 冒 险 (branch hazard)、 
控制 相关 (control dependency) 或 顺序 相关 (sequential dependency) 。 

数据 冒险 (data Hazard) 

在 指令 流水 线 中 ,后 面 指令 用 到 前 面 指令 的 结果 时 ,前 面 指令 的 结果 还 没 产 生 的 现象 称 
为 数据 冒险 ,也 称 为 数据 相关 (data dependency) 。 

流水 线 阻塞 (pipeline stall)/ 气 泡 (bubble) 

流水 线 中 下 一 条 指令 不 能 执行 时 ,就 在 硬件 上 加 入 额外 的 电路 来 使 得 下 一 条 指令 延迟 
若干 周期 再 执行 ,这 种 方式 称 为 流水 线 阻 塞 或 流水 线 停顿 。 有 时 也 会 形象 地 称 这 种 做 法 为 
在 流水 线 中 插入 气泡 (bubble) 。 

空 操作 (nop) 

空 操 作 就 是 不 做 任何 动作 ,而 只 是 在 时 间 上 延迟 一 段 时 间 。 有 两 种 情况 : 为 了 规整 
流水 线 , 在 某 些 指令 的 执行 过 程 中 加 入 空 流水 段 , 这 种 空 流水 段 中 的 操作 称 为 空 操 作 ;@ 为 
了 避免 流水 线 冒 险 ,在 相关 指令 的 前 后 加 入 nop 指令 ,使 得 流水 线 停顿 若干 时 钟 ,等 到 需要 
的 信息 得 到 后 再 继续 执行 后 面 的 指令 。 

转发 (forwarding) 

当 后 面 指令 要 用 到 前 面 指令 的 结果 数据 时 ,前 面 流 水 段 部 件 中 得 到 的 数据 直接 通过 连 
线 传送 到 后 面 流水 段 的 部 件 中 ,而 不 等 待 前 面 指令 的 结束 。 这 种 方式 称 为 转发 或 旁 路 , 它 能 
解决 部 分 数据 冒险 。 
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旁 路 (bypassing) 

是 数据 转发 技术 的 别称 。 

分 支 条 件 满足 (branch taken)/ 分 支 条 件 不 满足 (branch not taken) 

对 于 条 件 转移 指令 ( 即 分 支 指令 branch) ,其 执行 结果 总 有 两 种 可 能 性 : 一 种 是 条 件 满 
足 ( 称 为 branch taken) ,此 时 转 到 转移 目的 地 址 处 继续 执行 ; 另 一 种 是 条 件 不 满足 ( 称 为 
branch not taken) ,此 时 则 继续 取 下 条 指令 执行 。 

分 支 预测 (branch predict) 

在 流水 线 执行 过 程 中 ,对 每 条 分 支 指令 进行 预测 ,可 以 简单 地 预测 branch taken 或 
branch not taken, 也 可 以 根据 历史 情况 动态 预测 。 这 样 ,只 要 预测 成 功 ,流水 线 就 不 会 发 生 
阻塞 。 如果 预 测 不 成 功 , 则 流水 线 要 退回 到 正确 的 分 支 地 址 处 重新 启动 流水 线 执行 ,原先 不 
该 取出 执行 的 指令 要 排除 出 流水 线 , 称 为 清洗 或 冲刷 (flush) 流 水 线 。 

分 支 延 迟 (delayed branch) 

分 支 延 迟 调度 方法 采用 编译 优化 方法 调整 指令 执行 顺序 ,将 分 支 指令 前 面 与 分 支 指令 
无 关 的 指令 放 到 分 支 指令 后 面 执行 以 填充 延迟 损失 时 间 片 (分 支 延 迟 槽 ) ,不 够 时 再 用 nop 
操作 填充 ,这 样 ,使 得 分 支 指令 能 在 足够 的 时 间 内 得 到 跳 转 地 址 计算 结果 ,从 而 避免 流水 线 
的 阻塞 。 

分 支 延 迟 损失 时 间 片 (penalty for branch delay) 

由 于 分 支 指令 引起 流水 线 阻塞 而 带 来 的 延迟 执行 时 钟 周期 数 , 也 称 为 分 支 延迟 时 间 片 。 

分 支 延 迟 槽 (branch delay slot) 

分 支 延迟 调度 方法 中 ,分 支 指令 后 面 被 填充 的 指令 位 置 称 为 分 支 延迟 槽 。 需 要 填 人 的 
指令 条 数 ( 即 分 支 延迟 槽 数 ) 等 于 分 支 延 迟 损失 时 间 片 。 

指令 级 并 行 (Instruction Level Parallelism,ILP) 

在 CPU 执行 程序 时 ,通过 多 条 指令 之 间 的 并 行 执行 来 提高 处 理 器 性 能 的 一 种 技术 。 

IPC( Instruction Per Clock) 

每 个 时 钟 周期 内 可 以 执行 完成 的 指令 条 数 , 是 CPI 的 倒数 。 

超 流水 线 (superpipelining) 

是 指 具 有 更 多 级 流水 段 的 一 种 流水 线 。 理 想 情况 下 ,流水 线 阶 段 越 多 , 则 指令 的 吞吐 率 
越 高 ,所 以 一 些 处 理 器 采用 8 个 或 更 多 流水 阶段 , 称 为 超 流水 线 。 

超 长 指令 字 (Very Long Instruction Word,VLIW) 

通过 编译 器 静态 推测 来 辅助 完成 指令 打包 和 冒险 处 理 时 ,通常 将 一 个 周期 内 发 射 的 多 
个 指令 预先 组 织 为 一 条 具有 多 个 操作 的 长 指令 ,这 种 将 多 条 指令 打包 生成 的 指令 称 为 超 长 
指令 字 ,执行 这 种 超 长 指令 字 的 处 理 器 称 为 VLIW 处 理 器 。 

超标 量 流水 线 (superscalar) 

若干 条 指令 (如 整数 运算 、 浮 点 运算 、 装 人 /存储 等 ) 同 时 启动 并 独立 进入 流水 线 执行 。 
即 : 每 个 时 钟 周期 发 射 多 条 指令 ,有 多 套 取 指 部 件 和 指令 译 码 部 件 , 并 且 同时 有 多 条 指令 执 
行 ,所 以 应 有 多 个 执行 部 件 ,如 定点 处 理 部 件 、 浮 点 处 理 部 件 、 乘 /除法 部 件 、 取 数 / 存 数 部 件 
等 。 超 标量 流水 线 是 一 种 多 指令 发 射 (multiple-instruction issue) 方 式 。 

动态 流水 线 (dynamic pipelining) 

动态 流水 线 通 过 指令 相关 性 检测 和 动态 分 支 预 测 等 手段 ,投机 性 地 不 按 指令 顺序 执行 ， 
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当 发 生 流水 线 阻塞 时 ,可 以 到 后 面 找 指令 来 执行 。 动 态 流水 线 的 通用 模型 由 以 下 主要 单元 
组 成 : 指令 预 取 和 分 发 单元 ,执行 单元 ,提交 单元 。 这 种 调整 指令 执行 顺序 的 方式 称 为 动态 
流水 线 调度 (dynamic pipeline scheduling)。 

指令 预 取 (instruction prefetch) 

在 指令 执行 前 ,预先 把 指令 取 到 CPU 的 指令 缓冲 器 中 。 这 样 ,在 指令 执行 时 ,不 需要 
再 去 取 指 令 , 可 以 很 快 地 直接 执行 指令 。 流 水 线 指令 执行 方式 中 通常 采用 指令 预 取 方式 。 

指令 分 发 (instruction dispatch) 

对 指令 队列 中 的 指令 进行 译 码 ,根据 译 码 结果 将 指令 分 派 到 相应 的 执行 单元 。 用 来 进 
行 指令 译 码 和 分 发 的 部 件 称 为 分 发 单元 。 

静态 多 发 射 (static multiple issue) 

通过 编译 器 静态 推测 来 辅助 完成 指令 打包 和 冒险 处 理 。 通 常 将 一 个 周期 内 发 射 的 多 个 
指令 预先 组 织 为 一 条 多 个 操作 的 长 指令 , 称 为 一 个 “发 射 包 ”。 静 态 多 发 射 处 理 器 主要 考虑 
处 理 数 据 冒 险 和 控制 冒险 。 

动态 多 发 射 (dynamic multiple issue) 

通过 在 指令 执行 过 程 中 由 处 理 器 硬件 动态 完成 流水 线 调度 来 完成 指令 打包 和 冒险 处 
理 。 目 前 的 超标 量 处 理 器 大 多 采用 动态 多 发 射流 水 线 。 

按 序 发 射 (in-order issue) 

按照 程序 中 原来 的 指令 顺序 进行 指令 发 射 。 

无 序 发 射 (out-of-order issue) 

不 按 程序 中 原来 的 顺序 发 射 指令 ,把 可 能 发 生 冒 险 的 指令 推 后 发 射 , 而 把 后 面 无 冒险 的 
指令 提前 发 射 。 

指令 执行 单元 (instruction execute unit) 

用 来 执行 指令 的 功能 部 件 。 在 动态 流水 线 中 ,不 同 的 指令 被 分 派 到 不 同 的 指令 执行 单 
元 中 。 例 如 整数 运算 单元 、 浮 点 运算 单元 、 存 数 单元 、 取 数 单元 等 。 

存储 站 (reservation station) 

在 动态 调度 流水 线 中 ,每 个 执行 单元 都 有 自己 的 缓存 ,用 来 保存 当前 执行 的 指令 、 操 作 
数 和 结果 等 ,这 个 缓存 称 为 存储 站 。 

乱 序 执行 (out-of-order execution) 

在 指令 执行 单元 有 很 多 指令 同时 被 执行 ,而 且 每 种 指令 所 用 的 执行 时 间 也 不 一 样 ,所 
以 ,无 法 按照 程序 中 原来 的 顺序 执行 指令 ,因此 ,动态 流水 线 中 ,指令 一 定 是 乱 序 执行 的 。 

重 排序 缓冲 (reorder buffer) 

因为 指令 执行 是 无 序 的 ,所 以 ,需要 对 执行 后 的 指令 重新 排序 ,在 指令 最 后 提交 前 先 要 
将 其 存放 在 重 排序 缓存 中 。 

指令 提交 单元 (instruction commit unit) 

将 指令 执行 的 结果 写 到 结果 寄存 器 或 存储 单元 中 以 完成 指令 最 后 一 步 操作 。 提 交 单 元 
在 重 排序 缓冲 中 保存 所 有 挂 起 的 指令 ,根据 分 支 功能 单元 执行 的 结果 确定 预测 是 否 成 功 , 从 
而 确定 哪些 指令 需 从 重 排序 缓冲 中 清除 ,哪些 指令 可 以 写 结果 以 提交 。 

按 序 完 成 (in-order completion) 

按照 程序 中 原来 的 指令 顺序 完成 指令 的 执行 。 


骨 仿 流水 线 


无 序 完成 (out-of-order completion) 

不 按照 程序 中 原来 的 指令 顺序 完成 指令 的 执行 。 

按 序 发 射 按 序 完成 

按照 程序 中 原来 的 指令 顺序 预 取 \ 译 码 和 分 发 ,也 按 原来 的 指令 顺序 完成 指令 的 执行 。 

按 序 发 射 无 序 完成 

程序 中 按照 原来 的 指令 顺序 预 取 、 译 码 和 分 发 ,但 不 按 原来 的 指令 顺序 完成 指令 的 
执行 。 
无 序 发 射 无 序 完成 

不 按照 程序 中 原来 的 指令 顺序 预 取 , 译 码 和 分 发 ,也 不 按 原来 的 指令 顺序 完成 指令 的 
执行 。 
写 后 读 (RAW) 相 关 
若 前 一 条 指令 对 某 寄存 器 单元 写 人 ,后 一 条 指令 需要 从 同一 个 寄存 器 读 出 , 则 称 这 两 条 
指令 是 写 后 读 相 关 的 。 

写 后 写 (WAW) 相 关 

若 前 一 条 指令 和 后 一 条 指令 都 需要 对 同一 个 寄存 器 进行 写 人 , 则 称 这 两 条 指令 是 写 后 
写 相 关 的 。 这 种 相关 性 ,在 无 序 发 射 或 乱 序 执行 时 可 能 会 发 生 数据 冒险 ,而 在 按 序 发 射 和 完 
成 时 ,不 会 发 生 数据 冒险 。 


6.4 常见 问题 解答 


1. 什么 样 的 指令 格式 更 适合 流水 线 方式 ? 

答 : 定 长 指令 字 和 定 长 操作 码 使 得 每 条 指令 的 预 取 及 译 码 操作 时 间 完 全 一 致 ,便于 流 
水 线 控制 ;指令 类 型 少 ,操作 数 地 址 规整 ,便于 规划 取 操作 数 步 又 ,并 使 得 对 指令 进行 译 码 的 
同时 ,可 以 读 取 寄存 器 操作 数 ;采用 Load/Store 型 指令 格式 ,便于 利用 执行 运算 步骤 来 进行 
地 址 计算 。 上 述 这 些 都 是 RISC 指令 系统 的 特点 ,由 此 可 知 ,RISC 指令 设计 风格 更 适合 于 
流水 线 方式 。 

2. 采用 流水 线 方式 能 使 一 条 指令 的 执行 时 间 更 短 吗 ? 

答 : 不 能 。 采 用 流水 线 方式 使 得 指令 吞吐 率 提高 了 , 即 在 给 定 的 时 间 内 完成 指令 执行 
的 条 数 增加 了 ,但 每 条 指令 的 执行 过 程 没有 减少 ,因此 不 会 缩短 一 条 指令 的 执行 时 间 , 相 反 ， 
流水 线 方式 还 会 延长 一 条 指令 的 执行 时 间 。 

3. 为 什么 流水 线 方式 会 延长 一 条 指令 的 执行 时 间 ? 

答 : 因为 在 确定 一 条 流水 线 的 流水 段 个 数 时 ,是 以 最 复杂 指令 执行 过 程 所 需 的 流水 段 
个 数 为 标准 设计 的 ;在 确定 每 个 流水 段 的 宽度 时 ,也 以 最 复杂 流水 有 段 所 需 的 宽度 来 设计 。 因 
而 ,所 有 指令 都 需要 花费 最 慢 指令 所 需 的 执行 时 间 才 能 完成 执行 。 此 外 ,每 个 流水 段 之 间 要 
有 信息 的 缓存 和 传递 等 ,这 也 增加 了 额外 的 执行 时 间 开销 。 

4. 二 阶段 流水 线 能 成 倍 提高 指令 执行 效率 吗 ? 

答 : 不 能 。 二 阶段 流水 线 把 一 个 指令 周期 分 成 取 指 令 和 执行 指令 两 个 阶段 ,是 最 简单 
的 流水 线 , 它 不 能 成 倍 提高 指令 执行 效率 。 有 很 多 原因 ,主要 如 下 : 因为 每 条 指令 的 执行 
阶段 所 花 时 间 不 同 ,流水 线 要 求 以 最 慢 指令 为 标准 来 设计 ,所 以 ,执行 阶段 时 间 可 能 会 很 长 ; 
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@@ 虽 然 每 条 指令 的 取 指令 过 程 可 能 一 样 , 但 是 流水 线 中 要 求 每 个 流水 段 的 时 间 相同 ,所 以 ， 
取 指令 阶段 时 间 也 要 和 最 慢 指令 的 执行 时 间 一 样 ;@ 流 水 段 寄 存 器 的 读 写 会 增加 一 定 的 延 
迟 ; @ 各 种 流水 线 冒 险 会 破坏 流水 线 ,造成 流水 线 的 停顿 ,影响 指令 执行 效率 。 

5. 加 们 流水线 的 阶段 数 能 成 倍 提高 指令 执行 效率 吗 ? 

答 : 不 能 。 一 般 来 说 ,加 倍 流水 线 的 阶段 数 会 提高 指令 的 执行 效率 ,但 是 不 能 按 比例 成 
倍 提高 。 主 要 原因 是 因为 增加 流水 段 ,使 得 流水 段 之 间 的 流水 线 寄存 器 的 开销 增加 了 。 例 
如 ,假定 一 个 三 阶段 流水 线 的 每 一 级 流水 段 中 组 合 逻辑 延 时 为 100ps ,流水 段 寄存 器 延 时 为 
20ps, 则 时 钟 周期 至 少 为 100 十 20=120ps, 吞 吐 率 为 1/120pss8. 33GOPS( 每 秒 千 兆 次 操 
作 ) ,指令 延 时 至 少 为 3X120=360ps; 如 果 流 水 段 数 成 倍增 加 到 六 段 , 则 每 个 流水 段 的 组 合 
逻辑 延 时 变 为 50ps, 故 时 钟 周期 变 为 50 十 20=70ps, 香 吐 率 为 1/70pss*14. 29GOPS ,指令 
延 时 为 6X70 二 420ps。 所 以 ,性 能 只 提高 到 大 约 14. 29/8. 33s1. 71 倍 ,而 不 是 两 倍 , 指 令 
延 时 增加 了 420 一 360 王 60ps, 这 主要 是 流水 段 寄 存 器 增加 的 延 时 。 

6. 流水 线 深度 越 深 ,时 钟 频率 就 越 高 ,对 吗 ? 

答 : 一 般 来 说 ,在 指令 执行 时 间 一 定 的 情况 下 ,流水 线 深度 越 深 , 时 钟 频率 就 越 高 。 增 
加 流水 段 个 数 ,使 得 每 个 流水 段 内 的 操作 变 得 非常 简单 ,因而 ,每 个 阶段 的 延 时 就 很 小 ,也 就 
缩短 了 时 钟 周期 ,提高 了 时 钟 频率 。 但 是 ,流水 线 深 度 不 能 无 限制 地 提高 , 随 着 流水 段 个 数 
的 增加 ,流水 段 之 间 的 流水 段 寄 存 器 增多 ,加 大 了 流水 段 之 间 缓 冲 的 额外 开销 , 当 额 外 开销 
的 比例 达到 50% 时 ,再 增加 流水 线 的 深度 就 没有 意义 了 。 此 外 ,用 于 流水 线 优化 和 存储 器 
(或 寄存 器 ) 冲 突 处 理 的 控制 逻辑 将 随 流水 线 深度 的 加 深 而 大 量 增多 ,可 能 导致 用 于 流水 段 
之 间 控 制 的 逻辑 比 流水 段 本 身 的 控制 逻辑 更 复杂 。 

7. 流水 线 方式 下 ,如 何 确定 流水 段 的 个 数 ? 

答 : 流水 线 方式 下 ,一 条 指令 的 执行 过 程 被 分 成 了 若干 个 操作 子 过 程 。 由 于 每 条 指令 
所 完成 的 功能 不 同 ,所 包含 的 操作 过 程 就 不 同 。 有 的 指令 要 求 完成 寄存 器 之 间 内 容 的 传送 ， 
有 的 就 是 简单 的 加 / 减 运 算 , 还 有 的 是 复杂 的 乘 / 除 运算 。 这 些 操作 所 花 的 时 间 相 差 很 大 , 因 
此 ,这 些 指令 如 果 都 在 同一 个 流水 线 中 执行 ,就 必须 按 最 复杂 的 指令 来 设计 流水 线 的 流水 段 
个 数 。 现 代 计 算 机 一 般 把 复杂 度 相近 的 指令 用 同一 条 流水 线 完 成 ,而 把 复杂 度 相差 很 大 的 
指令 安排 在 不 同 的 流水 线 中 。 

8. 流水 线 方式 执行 指令 时 ,总 能 在 一 个 时 钟 周期 内 完成 一 条 指令 的 执行 吗 ? 

答 : 不 能 。 理 想 情况 下 ,经 过 若干 周期 后 ,能 在 每 个 时 钟 周期 内 执行 完 一 条 指令 , 即 
CPI==1。 但是, 当 程 序 中 出 现 以 下 情况 时 ,流水 线 被 破坏 ,因而 ,不 能 达到 CPI 二 1。Q@ 当 有 
多 条 指令 的 不 同 阶段 都 要 用 到 同一 个 功能 部 件 时 ,发 生 资 源 冲突 ,后 面 指 令 要 延 时 执行 ; 
@ 当 程序 的 执行 流程 发 生 改 变 时 ,发 生 控制 相关 ,原来 按 顺 序 取出 的 指令 无 效 ; @ 当 后 面 指 
令 的 操作 数 是 前 面 指令 的 运行 结果 时 ,发 生 数据 相关 ,后 面 指令 要 延 时 执行 。 此 外 ,还 有 
cache 缺失 、TLB 缺失 、 异 常 和 中 断 等 的 发 生 都 会 阻塞 流水 线 的 执行 。 

9. 如 何 解 决 结构 冒险 ? 

答 : 通过 以 下 两 种 规整 流水 线 结构 的 方式 可 以 解决 部 分 结构 冒险 。Q@ 规 定 每 个 功能 部 
件 在 每 条 指令 执行 过 程 中 只 能 被 使 用 一 次 ,例如 ,每 条 指令 只 能 用 一 次 “寄存 器 写 口 ”; 四 每 
个 功能 部 件 只 能 在 一 个 特定 的 流水 段 内 被 使 用 。 例 如 ,“ 寄 存 器 写 口 ” 只 能 在 第 5 个 流水 阶 
段 被 使 用 。 


另外 ,指令 和 数据 分 别 存 放 在 不 同 的 存储 器 中 ,使 得 同时 访问 指令 和 数据 不 会 引起 存储 
器 资源 的 结构 冒险 。 这 在 大 多 数 处 理 器 中 都 是 这 样 的 ,因为 在 L1 cache 的 data cache 和 
code cache 是 分 开 的 。 

10. 什么 是 控制 冒险 ? 哪些 情况 下 会 发 生 控 制 冒险 ? 

答 : 正常 情况 下 PC 的 值 按 顺序 增 量 ,但 在 执行 转移 类 指令 或 发 生 异 常 和 中 断 时 ,PC 的 
值 由 指令 或 异常 /中 断 处 理 部 件 给 出 。 流 水 线 方式 下 ,如 果 在 取 下 一 条 指令 时 ,正确 的 下 条 
指令 地 址 还 没有 送 到 PC 中 ,那么 所 取 的 下 条 指令 就 不 是 正确 的 ,因而 发 生 控制 冒险 。 可 以 
看 出 ,如 果 确 定 下 条 指令 地 址 所 用 时 间 较 长 ,就 会 因为 来 不 及 在 一 个 时 钟 周期 内 得 到 正确 的 
PC 值 而 发 生 控 制 冒险 。 通 常 ,转移 类 指令 会 发 生 控制 冒险 ,例如 ,分 支 指令 (条 件 转 移 指 
令 ) 要 根据 条 件 测试 结果 来 确定 PC 的 值 ,因而 会 发 生 控制 冒险 ;返回 指令 需要 从 存储 器 中 
读 取 返回 地 址 送 PC, 因 而 也 会 发 生 控 制 冒险 。 

11. 无 条 件 转移 (如 跳 转 指令 ,调用 指令 等 ) 是 否 可 以 避免 发 生 控制 冒险 ? 

答 : 可 能 会 发 生 控制 冒险 。 如 果 不 把 取 指 令 操 作 和 译 码 操作 合成 一 个 阶段 ,就 会 引起 
控制 冒险 。 因 为 要 等 到 译 码 阶段 才 知 道 是 转移 指令 ,而 此 时 流水 线 中 正在 取 下 条 顺序 执行 
的 指令 ,即使 译 码 阶段 能 够 得 到 转移 目标 地 址 ,也 已 经 有 一 条 不 该 执行 的 指令 在 流水 线 中 ， 
也 即 流水 线 被 阻塞 了 一 个 时 钟 周期 。 在 下 个 时 钟 周期 到 达 时 ,应 把 已 经 取出 的 下 条 指令 清 
零 ,并 把 转移 目标 地 址 送 PC ,重新 从 转移 目标 地 址 处 取 指 令 执 行 。 

12. 流水 线 中 如 何 控制 在 同一 时 钟 内 各 流水 段 中 执行 不 同 的 指令 ? 

答 : 对 于 每 条 指令 来 说 ,流水 线 中 前 面 的 取 指 令 流 水 段 和 指令 译 码 流水 段 都 是 一 样 的 ， 
所 以 这 两 个 流水 段 中 的 操作 没有 必要 和 哪个 指令 对 应 。 但 是 ,指令 译 码 以 后 ,每 个 流水 段 中 
执行 的 动作 一 定 要 和 特定 的 指令 对 应 ,也 就 是 说 ,特定 指令 对 应 的 控制 信号 一 定 要 送 到 对 应 
的 流水 段 中 ,以 控制 该 流水 段 中 的 执行 部 件 完 成 正确 的 动作 。 这 样 也 就 可 以 控制 在 同一 时 
钟 内 各 流水 段 执行 不 同 的 指令 。 要 做 到 特定 指令 对 应 的 控制 信号 送 到 对 应 的 流水 段 中 ,只 
要 将 译 码 阶段 得 到 的 控制 信号 也 以 流水 线 的 方式 传送 ,每 来 一 个 时 钟 周期 ,控制 信号 就 往 后 
面 一 个 流水 段 传送 一 次 ,这 样 使 得 控制 信号 和 所 控制 的 操作 同步 。 

13. 指令 译 码 前 控制 信号 还 没有 产生 ,那么 如 何 控制 译 码 前 指令 的 动作 呢 ? 

答 : 任何 指令 总 是 先 要 取 指令 ,然后 对 指令 译 码 ,根据 指令 的 不 同 产生 不 同 的 控制 信号 
控制 数据 通路 完成 不 同 的 指令 功能 。 也 就 是 说 ,在 指令 译 码 前 控制 信号 还 没有 产生 ,所 以 ， 
不 可 能 有 控制 信号 来 控制 译 码 前 指令 的 动作 。 

对 所 有 指令 来 说 , 取 指 令 和 指令 译 码 两 个 阶段 的 动作 都 是 一 致 的 ,只 要 让 这 两 个 阶段 的 
功能 部 件 完 成 特定 的 功能 就 行 了 ,而 无 须 区 分 是 哪 条 指令 对 应 的 功能 ,因而 也 就 不 需要 控制 
信号 对 其 进行 控制 。 


6.5 单项 选择 题 


1. 以 下 关于 指令 流水 线 设计 的 叙述 中 ,错误 的 是 ( 。 )。 
A. 指令 执行 过 程 中 的 各 个 子 功能 都 需要 包含 在 某 个 流水 段 中 
B. 所 有 子 功能 都 必须 按 一 定 的 顺序 经 过 流水 段 
C. 虽然 各 子 功能 所 用 实际 时 间 可 能 不 同 ,但 经 过 每 个 流水 段 的 时 间 都 一 样 
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D. 任何 时 候 各 个 流水 段 的 功能 部 件 都 不 可 能 执行 空 (nop) 操 作 
2. 以 下 关于 流水 段 寄 存 器 的 叙述 中 ,正确 的 是 ( ss 
A. 指令 译 码 得 到 的 控制 信号 需 通 过 流水 段 寄存 器 传递 到 下 一 个 流水 段 
B. 每 个 流水 段 之 间 的 流水 段 寄 存 器 位 数 一 定 相同 
C. 每 个 流水 段 之 间 的 流水 段 寄 存 器 存放 的 信息 一 定 相 同 
D. 用 户 程序 可 以 通过 指令 指定 访问 哪个 流水 段 寄存 器 
3. 以 下 关于 指令 流水 线 和 指令 执行 效率 关系 的 叙述 中 ,错误 的 是 ( )s 
A. 加 倍增 加 流水 段 个 数 不 能 成 倍 提高 指令 执行 效率 
B. 为 了 提高 指令 吞吐 率 , 流 水 段 个 数 可 以 无 限制 地 增多 
C. 加 深 流水 线 深度 ,可 以 提高 处 理 器 的 时 钟 频率 
D. 随 着 流水 段 个 数 的 增加 ,流水 段 之 间 缓 存 开销 的 比例 增 大 
4， 以 下 有 关 流 水 线 数据 通路 的 描述 中 ,错误 的 是 ( 站 
A. 每 个 流水 段 由 执行 指令 子 功能 的 功能 部 件 和 流水 段 寄 存 器 组 成 
B. 控制 信号 仅 作 用 在 功能 部 件 上 ,时钟 信号 仅 作 用 在 流水 有 段 寄 存 器 上 
C. 在 没有 阻塞 的 情况 下 ,PC 的 值 在 每 个 时 钟 周 期 都 会 改变 
D. 取 指令 阶段 和 指令 译 码 阶 段 不 需要 控制 信号 的 控制 
5. 某 计算 机 的 指令 流水 线 由 4 个 功能 段 组 成 ,指令 流 经 各 功能 有 段 的 时 间 ( 忽 略 各 功能 
段 之 间 流 水 段 寄存 器 的 缓存 时 间 ) 分 别 为 90ns、80ns、70ns 和 60ns, 则 该 计算 机 的 CPU 时 钟 
周期 至 少 是 ( % 
A. 90ns B. 80ns C. 70ns D. 60ns 
6. 假定 执行 最 复杂 的 指令 需要 完成 6 个 子 功能 ,分 别 由 对 应 的 功能 部 件 A~F 来 完 
成 ,每 个 功能 部 件 所 花 的 时 间 分 别 为 80ps、40ps、50ps、70ps、20ps、30ps, 流 水 段 寄存 器 延 时 
为 20ps, 现 把 最 后 两 个 功能 部 件 E 和 下 合并 ,以 产生 一 个 5 段 流水 线 。 该 5 段 流水 线 的 时 
钟 周期 至 少 是 ( )ps。 
A. 70 B. 80 C. 90 D. 100 
7. 以 下 有 关 流 水 段 的 功能 部 件 的 描述 中 ,错误 的 是 ( )s 
A. 所 有 功能 部 件 都 是 用 组 合 罗 辑 实现 的 
B. 同一 个 功能 部 件 可 以 在 不 同 的 流水 段 中 被 使 用 
C. 每 个 功能 部 件 在 每 条 指令 中 都 只 被 使 用 一 次 
D. 寄存 器 写 口 只 能 在 指令 结束 时 的 “ 写 回 ”阶段 被 使 用 
8. 以 下 给 定 的 情况 中 ,不 会 引起 指令 流水 线 阻 塞 的 是 ( Ys 


A. 访 存 冲 突 B. 指令 数据 相关 
C. 执行 空 操 作 指 令 D. cache 缺失 

9. 以 下 给 定 的 情况 中 ,不 会 引起 指令 流水 线 阻 塞 的 是 (  )。 
A. 数据 旁 路 (转发 ) B. TLB 缺失 
C. 条 件 转 移 D. 外 部 中 断 


10. 以 下 是 关于 结构 冒险 的 叙述 : 
〇 结构 冒险 是 指 同时 有 多 条 指令 使 用 同一 个 资源 
@ 避免 结构 冒险 的 基本 做 法 是 使 每 个 指令 在 相同 流水 段 中 使 用 相同 的 部 件 


@ 重复 设置 功能 部 件 可 以 避免 结构 冒险 
@ 数据 cache 和 代码 cache 分 离 可 解决 两 条 指令 同时 分 别 访问 数据 和 指令 的 冒险 
以 上 叙述 中 ,正确 的 有 (  ”)。 
A. OD 和 @ 和 @  B. OD 和 @ 和 ® C. DO 和 ®@ 和 @ D. 全 部 
11. 以 下 是 关于 数据 冒险 的 叙述 
Q@ 数据 冒险 是 指 后 面 指 令 用 到 的 数据 还 未 来 得 及 由 前 面 指令 产生 
@ 在 发 生 数据 冒险 的 指令 之 间 插入 空 操作 指令 能 避免 数据 冒险 
@ 采用 转发 ( 旁 路 ) 技 术 可 以 解决 一 部 分 数据 冒险 现象 
@ 通过 编译 器 调整 指令 顺序 可 解决 部 分 数据 冒险 
以 上 叙述 中 ,正确 的 有 (  ”)。 
A. OQ 和 @ 和 @ B. O 和 @ 和 ® C. OD 和 @ 和 @ D. 全 部 
12. 以 下 是 关于 控制 冒险 的 叙述 
Q 条 件 转移 指令 执行 时 可 能 会 发 生 控制 冒险 
@ 在 分 支 指令 后 加 入 若干 空 操作 指令 可 避免 控制 冒险 
@ 采用 转发 ( 旁 路 ) 技 术 可 以 解决 部 分 控制 冒险 
@ 通过 编译 器 调整 指令 顺序 可 解决 部 分 控制 冒险 
以 上 叙述 中 ,正确 的 有 ( ”)。 
A. QO 和 @ 和 @ B. O 和 @ 和 ® C. DO 和 @ 和 @ D. 全 部 
13. 以 下 是 有 关 分 支 预测 的 叙述 ; 
@ 分 支 预测 技术 可 用 于 控制 冒险 和 数据 冒险 处 理 
@ 采用 静态 预测 技术 时 ,每 次 的 预测 结果 总 是 一 样 
@@ 通常 情况 下 ,动态 预测 比 静 态 预测 的 预测 成 功率 高 
@ 预测 错误 时 已 被 错误 地 取 到 流水 线 执行 的 指令 必须 被 冲刷 掉 
以 上 叙述 中 ,正确 的 有 ( ”)。 
A. 0 和 @ 和 @ B. OD 和 @ 和 @ C. @ 和 @ 和 @ D. 全 部 
14. 以 下 是 一 段 MIPS 指令 序列 ， 
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和 loop: add S$tl，$s3，$s3 #R[$t1]<R[I$s3]+R[$s3] 

2 add $t1, $t1l, $t1 #R[IStl]<RIStl]+R[Stl] 

3 lw $t0, 0($t1) #R[$t0]<M[IR[$t1]+0] 

4 bne $t0, $s5, exit #if(R[St0] 天 R[$s5])then go to exit 
5 add $s3, $s3, $s4 #R[$s3]<R[$s3]+R[$s4] 

6 也 loop #go to loop 

7 xits 


以 上 指令 序列 中 ,第 ( 。”“”) 条 指令 产生 了 一 个 分 支 控制 冒险 。 

A.2 B. 4 C5 日 于 /| 
15. 以 下 是 一 段 MIPS 指令 序列 ; 
1 aqdd $tl, $tO, $t1 #R[$t1]<R[$tO]+R[$t1] 


2 lw $t0, 0($t1) #R[$t0]<MIRI$t1]+0] 
3 bne $t0, $s5, exit #if (R[$t0]R[$s5])then go to exit 
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4 add $s3, $s5, $s4 #R[$s3]<R[$s5]+R[$s4] 
§ exit: 
以 上 指令 序列 中 ,( ”) 指 令 之 间 产 生 数 据 相关 。 
A. 1 和 2.2 和 3 B. 1 和 2.2 和 3.3 和 4 
C. 1 和 2.1 和 3 D. 1 和 2.1 和 3.2 和 3 
16. 以 下 是 一 段 MIPS 指令 序列 : 
L addi $tl, $zero, 20 #R[$t1]<20 
4 lw $t2, 12($a0) #R[$t2]<M[R[$a0]+12] 
3 add $vO, $tl, $t2 #R[$vO]<RI$t1]+R[$t2] 


以 上 指令 序列 中 ,第 1 和 第 3、 第 2 和 第 3 条 指令 之 间 发 生 数 据 相 关 。 假 定 采用 “ 取 指 、 
译 码 / 取 数 .执行 . 访 存 . 写 回 ?这 种 5 段 流 水 线 方式 ,并 控制 在 时 钟 的 前 半 周 期 写 寄存 器 堆 ， 
后 半 周 期 读 寄存 器 堆 , 那 么 不 采用 “转发 "技术 时 ,需要 在 第 3 条 指令 前 加 入 ( ””) 条 空 操 作 
(nop) 指 令 才能 使 这 段 程序 不 发 生 数 据 冒 险 。 
A. 1 B. 2 C3 D. 4 
17. 以 下 是 一 段 MIPS 指令 序列 : 


1 addi $tl, $zero, 20 #R[$t1]<20 
2 lw $t2, 12($a0) #R[$t2]<M[R[$a0]+12] 
EE add $vO, $tl, $t2 #R[$vO]<R[I$t1]+R[$t2] 


以 上 指令 序列 中 ,第 1 和 第 3、 第 2 和 第 3 条 指令 之 间 发 生 数 据 相关 。 假 定 采用 “ 取 指 、 
译 码 / 取 数 ,执行 , 访 存 、 写 回 "这 种 5 段 流水线 方式 ,那么 在 采用 “转发 ”技术 时 ,需要 在 第 3 
条 指令 前 加 入 ( 。 ”) 条 空 操作 (nop) 指 令 才 能 使 这 段 程序 不 发 生 数 据 冒 险 。 

A. 0 B1 C.2 D3 

18. 以 下 有 关 超标 量 技术 的 令 述 中 ,错误 的 是 ( 。 )。 

A. 超标 量 技术 是 指 在 流水 线 中 采用 更 多 的 流水 段 个 数 

B. 超标 量 方式 执行 指令 时 可 以 同时 发 射 多 条 指令 至 流水 线 中 

C. 采用 超标 量 技术 的 CPU 中 必须 配置 多 个 不 同 的 功能 部 件 

D. 采用 超标 量 技术 的 目的 是 利用 部 件 的 并 行 性 以 提高 指令 吞吐 率 

【参考 答案 】 

DB RID 

ll D WA 13C MM.B 1 A 16.B 1 B 1 & 

【部 分 题目 的 答案 解析 】 

4. 流水 线 数据 通路 中 ,控制 信号 也 可 以 作用 在 流水 段 寄 存 器 上 ,例如 , 当 发 生 流 水 线 阻 
塞 时 ,通常 需要 保持 流水 段 寄 存 器 IF/ID 中 的 指令 不 变 ,使 得 在 随后 一 个 时 钟 周 期 内 继续 对 
其 中 的 指令 进行 译 码 / 取 数 ,这 样 就 需要 有 相应 的 控制 信号 作用 在 IF/ID 上 。 同 时 ,时 钟 信 
号 也 不 是 仅仅 需要 作用 在 流水 段 寄 存 器 上 ,也 需要 作用 于 PC 或 其 他 功能 部 件 上 ,例如 , 需 
要 时 钟 信号 作用 于 某 个 特定 的 电路 ,以 产生 前 半 个 时 钟 周 期 写 寄存 堆 , 后 半 个 时 钟 周 期 读 寄 
存 器 堆 的 控制 信号 。 因 此 ,选项 B 中 的 说 法 是 错误 的 ,答案 为 选项 B。 

5. 流水 线 CPU 以 最 长 功能 段 时 间 为 基准 确定 时 钟 周期 ,通常 要 考虑 流水 段 寄 存 器 的 


指令 流水 线 


延 时 ,但 是 ,本 题 忽略 这 个 时 间 , 因 此 ,该 计算 机 CPU 时 钟 周期 至 少 是 90ns ,答案 为 选项 A。 

7. 流水 线 数据 通路 中 ,所 有 功能 部 件 都 属于 组 合 好 辑 , 每 个 功能 部 件 在 每 条 指令 中 都 
只 被 用 一 次 ,因而 不 可 能 在 不 同 的 流水 段 中 被 使 用 ,选项 C 的 说 法 是 错误 的 ,答案 为 选项 C。 

8. 执行 空 操作 指令 时 只 要 保证 最 终 没 有 信息 写 入 任何 寄存 器 和 存储 单元 就 行 ,因此 ， 
空 指令 的 执行 不 会 引起 指令 流水 线 阻塞 ,而 访 存 冲突 (两 条 以 上 指令 同时 要 求 访问 同一 个 存 
储 器 ) ,指令 数据 相关 和 cache 缺失 这 三 种 情况 的 发 生 都 会 导致 指令 无 法 正常 执行 下 去 ,从 
而 引起 指令 流水 线 阻塞 。 答 案 为 选项 C。 

16. 不 采用 “转发 "技术 时 ,需要 在 第 3 条 指令 前 加 入 两 条 空 操 作 (nop) 指 令 才能 使 这 段 
程序 不 发 生 数据 冒险 ,如 图 6. 5 所 示 。 答 案 为 选项 B。 


时 间 (时 钟 周 期 ) 
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add $v0, $t1l, $t2 















































1 
图 6.5 加 入 两 条 nop 指令 的 情况 


6.6 分 析 应 用 题 


1. 假定 某 计算 机 工程 师 想 设 计 一 个 新 CPU ,其 中 运行 的 一 个 典型 程序 的 核心 模块 需 
要 执行 一 百 万 条 指令 ,每 条 指令 执行 时 间 为 100ps。 

(1) 在 非 流水 线 处 理 器 上 执行 该 程序 大 约 需 要 花 多 长 时 间 ? 

(2) 若 新 CPU 是 一 个 20 级 流水 线 处 理 器 ,执行 上 述 同样 的 程序 ,理想 情况 下 , 它 比 非 
流水 线 处 理 器 快 多 少 ? 

(3) 实际 流水 线 并 不 是 理想 的 ,流水 段 之 间 的 数据 传送 会 有 额外 开销 。 这 些 开销 是 否 
会 影响 指令 执行 时 间 (instruction latency) 和 指令 吞吐 率 (instruction throughput)? 

【分 析 解 答 】 

(1) 非 流水 线 处 理 器 上 执行 该 程序 的 时 间 大 约 为 100psX10° 二 100ps。 

(2) 若 在 一 个 20 级 流水 线 的 处 理 器 上 执行 ,忽略 流水 段 之 间 的 寄存 器 延 时 ,理想 情况 
下 ,每 个 时 钟 周期 为 100/20=5ps, 所 以 ,程序 执行 时 间 大 约 为 5X105 王 5ps, 因 此 ,大 约 快 
100/5==20 倍 。 

(3) 流水 段 之 间 数 据 的 传递 产生 的 额外 开销 ,使 得 一 条 指令 的 执行 时 间 被 延长 , 即 影响 
了 指令 执行 时 间 ; 同 时 也 延长 了 每 个 流水 段 的 时 间 , 即 影响 了 指令 吞吐 率 。 
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2. 某 计 算 机 指令 流水 线 由 6 个 功能 段 组 成 ,依次 为 A~ 下 ,每 个 功能 段 的 组 合 逻辑 延迟 
分 别 为 80ps、30ps、60ps、50ps、60ps、20ps, 最 后 一 个 功能 段 需要 写 寄存 器 ,寄存 器 延 时 为 
20ps。 在 这 些 组 合 逻辑 块 之 间 插 入 必要 的 流水 段 寄 存 器 就 可 实现 相应 的 指令 流水 线 。 理 想 
情况 下 ,以 下 各 种 方式 所 得 到 的 时 钟 周期 指令 吞吐 率 和 指令 执行 时 间 各 是 多 少 ? 应 该 在 哪 
里 插入 流水 段 寄 存 器 (假定 插入 的 流水 段 寄 存 器 的 延 时 也 为 20ps)? 根据 对 以 下 4 种 情况 
的 分 析 , 你 能 得 到 什么 结论 ? 

(1) 插入 一 个 流水 段 寄 存 器 ,得 到 一 个 两 级 流水 线 。 

(2) 插入 两 个 流水 段 寄 存 器 ,得 到 一 个 三 级 流水 线 。 

(3) 插入 三 个 流水 段 寄存 器 ,得 到 一 个 四 级 流水 线 。 

(4) 吞吐 量 最 大 的 流水 线 。 

【分 析 解 答 】 

(1) 两 级 流水 线 的 平衡 点 在 C 和 D 之 间 , 其 前 面 一 个 流水 段 的 组 合 逻 辑 延 时 为 80 十 
30 十 60 王 170ps, 后 面 一 个 流水 段 的 组 合 逻辑 延 时 为 50 十 60 十 20 二 130ps。 最 长 功能 段 延 时 
为 170ps, 加 上 流水 段 寄 存 器 延 时 20ps, 因 而 时 钟 周期 为 190ps, 理 想 情况 下 ,指令 吞吐 率 为 
每 秒 钟 执行 1/190ps 二 5. 26G 条 指令 。 每 条 指令 在 流水 线 中 的 执行 时 间 为 2X190==380ps。 

(2) 两 个 流水 段 寄 存 器 分 别 插 在 B 和 C.D 和 下 之 间 , 这 样 第 一 个 流水 有 段 的 组 合 逻辑 延 
时 为 80 十 30=110ps, 中 间 第 二 段 的 延 时 为 60 十 50 二 110ps, 最 后 一 个 段 延 时 为 60 十 20= 
80ps。 这 样 ,每 个 流水 段 所 用 时 间 都 按 最 长 延 时 调整 为 110 十 20=130ps, 故 时 钟 周期 为 
130ps, 指 令 吞 吐 率 为 每 秒 钟 执行 1/130ps=7. 69G 条 指令 ,每 条 指令 在 流水 线 中 的 执行 时 
间 为 3X130==390ps。 

(3) 三 个 流水 段 寄存 器 分 别 插 在 A 和 B.C 和 DD 和 下 之 间 , 这 样 第 一 个 流水 段 的 组 
合 逻辑 延 时 为 80ps, 第 二 段 延 时 为 30 十 60=90ps, 第 三 段 延 时 为 50ps, 最 后 一 段 延 时 为 
60 十 20=80ps。 这 样 , 每 个 流水 段 都 以 最 长 延 时 调整 为 90 十 20= 110ps, 故 时 钟 周期 为 
110ps, 指 令 吞 吐 率 为 每 秒 钟 执行 1/110ps=9. 09G 条 指令 ,每 条 指令 在 流水 线 中 的 执行 时 
间 为 4X110=440ps。 

(4) 因为 各 功能 部 件 对 应 的 组 合 逻辑 中 最 长 延 时 为 80ps, 所 以 ,流水 线 的 时 钟 周期 肯定 
比 80 十 20=100ps 长 。 为 了 达到 最 大 吞吐 率 , 时 钟 周期 应 该 尽量 短 ,因此 ,最 合理 的 划分 方 
案 应 该 按照 每 个 时 钟 周期 为 100ps 来 进行 。 根 据 每 个 功能 部 件 所 用 时 间 可 知 ,流水 线 至 少 
按 5 有 段 来 划分 ,分 别 把 流水 线 寄存 器 插入 在 A 和 BB 和 CC 和 DD 和 下 之 间 , 这 样 各 段 
的 组 合 敢 辑 延 时 为 80ps、30ps、60ps,50ps 和 80ps。 其 中 ,最 后 一 个 延 时 80ps 是 下 和 下 两 个 
阶段 的 时 间 相 加 而 得 到 的 。 这 样 时钟 周 期 为 100ps ,指令 吞吐 率 为 每 秒 钟 执行 1/100ps = 
10G 条 指令 ,每 个 指令 的 执行 时 间 为 5X100 王 500ps。 

通过 对 上 述 4 种 情况 进行 分 析 , 可 以 得 出 以 下 结论 : 划分 的 流水 段 多 ,时 钟 周期 就 变 
短 ,指令 执行 吞吐 率 就 变 高 ,而 相应 的 额外 开销 ( 即 插入 的 流水 段 寄 存 器 的 延 时 ) 也 变 大 ,使 
得 一 条 指令 的 执行 时 间 变 长 。 

3. 假定 在 如 图 6. 1 所 示 的 5 级 流水 线 处 理 器 中 ,各 主要 功能 部 件 的 操作 时 间 如 下 : 存 
储 器 一 200ps,ALU 和 加 法 器 一 150ps, 寄 存 器 堆 读 口 和 写 口 一 50ps。 

(1) 若 执行 阶段 EX 所 用 的 ALU 操作 时 间 缩 短 20% , 则 能 和 否 加 快 流水 线 执行 速度 ? 如 
果 能 ,能 加 快 多 少 ? 如 果 不 能 ,为 什么 ? 


(2) 若 ALU 操作 时 间 增 加 20% ,对 流水 线 的 性 能 有 何 影响 ? 

(3) 若 ALU 操作 时 间 增 加 40% ,对 流水 线 的 性 能 又 有 何 影响 ? 

【分 析 解 答 】 

(1) ALU 操作 时 间 缩 短 20% 不 能 加 快 流水 线 指令 速度 。 因 为 指令 流水 线 的 执行 速度 
取决 于 最 慢 的 功能 部 件 所 用 时 间 , 最 慢 的 是 存储 器 ,只 有 缩短 了 存储 器 的 操作 时 间 才 可 能 加 
快 流水 线 速度 。 

(2) ALU 操作 时 间 延 长 20% 时 , 变 为 180ps, 比 存储 器 所 用 时 间 200ps 还 小 ,因此 ,对 流 
水 线性 能 没有 影响 。 

(3) ALU 操作 时 间 延 长 40% 时 , 变 为 210ps, 比 存储 器 所 用 时 间 200ps 大 ,因此 ,在 不 考 
虑 流水 段 寄 存 器 延 时 的 情况 下 ,流水 线 的 时 钟 周 期 从 200ps 变 为 210ps, 流 水 线 执行 速度 降 
低 了 (210 一 200)/200=5%。 

4. 下 面 是 一 段 MIPS 指令 序列 ， 


和 add S$tl, $sl, $s0 
4 sub $t2, $s0, $s3 
3 add $tl, $tl, $t2 


假定 在 一 个 采用 “ 取 指 、 译 码 / 取 数 , 执 行 , 访 存 、 写 回 " 的 5 段 流水 线 处 理 器 中 执行 上 述 
指令 序列 ,请 回答 下 列 问 题 : 

(1) 以 上 指令 序列 中 ,哪些 指令 之 间 发 生 数据 相关 ? 

(2) 不 采用 “转发 "技术 的 话 , 需 要 在 何 处 .加 入 几 条 nop 指令 才能 使 这 段 指令 序列 的 执 
行 避免 数据 冒险 ? 

(3) 如 果 采 用 “转发 ”技术 ,是 否 可 以 完全 解决 数据 冒险 ? 不 行 的 话 ,需要 在 何 处 .加 入 
几 条 nop 指令 才能 使 这 段 指令 序列 的 执行 避免 数据 冒险 ? 

【分 析 解 答 】 

(1) 因为 第 1 条 和 第 2 条 指令 都 会 更 新 第 3 条 指令 用 到 的 寄存 器 的 值 ,有 可 能 导致 第 3 
条 指令 取 操 作 数 时 得 到 的 是 更 新 前 的 数据 ,这 样 第 3 条 指令 就 不 能 正确 执行 ,因此 ,第 1 和 
第 3 条 指令 .第 2 和 第 3 条 指令 之 间 发 生 数据 相关 。 

(2) 不 进行 “转发 ”的话 ,就 只 能 通过 在 第 3 条 指令 前 加 nop 指令 来 延迟 第 3 条 指令 的 
执行 。 因 为 只 有 第 2 条 指令 把 数据 写 回 到 $t2, 第 3 条 指令 才能 从 $t2 取 到 正确 的 值 ,所 
以 ,第 2 条 指令 的 写 回 (Wr) 流 水 段 后 面 才 应 该 是 第 3 条 指令 的 译 码 / 取 数 (ID) 流 水 段 ,为 
此 ,在 第 2 和 第 3 条 指令 之 间 必 须 插 入 3 条 nop 指令 ,如 图 6.6 所 示 。 

若 将 寄存 器 写 口 和 寄存 器 读 口 分 别 安排 在 一 个 时 钟 周期 的 前 、 后 半 个 周期 内 独立 工作 ， 
使 得 前 半 周 期 写 入 寄存 器 的 内 容 在 后 半 周 期 能 够 正确 读 出 ,那么 ,只 要 加 入 两 条 nop 即 可 ， 
如 图 6.7 所 示 。 

(3) 采用 “转发 "技术 ,上 述 程序 段 可 以 完全 避免 数据 冒险 。 只 要 把 第 1 条 指令 访 存 
(Mem) 段 结束 时 在 流水 段 寄 存 器 中 的 $tl 的 值 和 第 2 条 指令 执行 (Ex) 段 结束 时 在 流水 段 
寄存 器 中 的 $t2 的 值 同时 “转发 到 第 3 条 指令 的 执行 (Ex) 段 中 ALU 的 两 个 输入 端 ,这 样 ， 
在 ALU 中 运算 的 两 个 操作 数 都 是 正确 的 值 ,不 会 发 生 数 据 冒险 ,无 须 再 插入 nop 指令 ,如 
图 6.8 所 示 。 
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题 4(2) 中 的 图 示 2 


图 6.7 
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题 4(3) 中 的 图 示 


图 6.8 


骨 仿 流水 线 


5. 下 面 是 一 段 MIPS 指令 序列 


add $s3, $sl, $s0 

sub $t2, $s0, $s3 

$t1,0($t2) 
add $tl, $tl, $t2 

假定 在 一 个 采用 “ 取 指 、 译 码 / 取 数 ,执行 . 访 存 , 写 回 " 的 5 段 流 水 线 处 理 器 中 执行 上 述 
指令 序列 ,该 流水 线 数据 通路 中 ,寄存 器 写 口 和 寄存 器 读 口 分 别 安排 在 一 个 时 钟 周 期 的 前 、 
后 半 个 周期 内 独立 工作 。 请 回答 下 列 问题 : 

(1) 以 上 指令 序列 中 ,哪些 指令 之 间 发 生 数据 相关 ? 

(2) 不 采用 “转发 "技术 的 话 , 需 要 在 何 处 .加 入 几 条 nop 指令 才能 使 这 有 段 指令 序列 的 执 
行 避免 数据 冒险 ? nop 指令 增加 的 百分比 为 多 少 ? 该 指令 序列 的 执行 共 需 要 多 少时 钟 
周期 ? 

(3) 如 果 采 用 “转发 ”技术 ,是 否 可 以 完全 解决 数据 冒险 ?不行 的 话 ,需要 在 何 处 .加 入 
几 条 nop 指令 才能 使 这 段 指令 序列 的 执行 避免 数据 冒险 ? 

(4) 若 数据 冒险 通过 硬件 阻塞 进行 处 理 , 则 在 不 采用 ”转发 ”和 采用 ”转发 "两 种 情况 下 ， 
执行 上 述 4 条 指令 的 CPI 分 别 是 多 少 ? 

【分 析 解 答 】 

(1) 发 生 数据 相关 的 是 : 第 1 和 第 2 条 指令 之 间 关 于 $s3, 第 2 和 第 3 条 指令 之 间 关 了 
$t2, 第 2 和 第 4 条 指令 之 间 关 于 $t2, 以 及 第 3 和 第 4 条 指令 之 间 关 于 $tl。 

(2) 不 进行 “转发 ”处理 的 话 ,需要 分 别 在 第 2.3、4 条 指令 前 加 2 条 nop 指令 才能 避免 
数据 冒险 , 共 加 了 6 条 nop 指令 。nop 指令 增加 的 百分比 为 6/4 王 150% , 即 平均 1 条 指令 加 
1.5 条 nop 指令 。 该 指令 序列 执行 所 需 的 时 钟 周期 数 为 (5 一 1) 十 (4 十 6)=14。 

(3) 通过 “转发 "可 以 避免 第 1 和 第 2 第 2 和 第 3、 第 2 和 第 4 条 指令 之 间 的 数据 相关 ; 
但 第 3 和 第 4 条 指令 之 间 是 load-use 数据 相关 ,因此 ,无 法 用 “转发 "消除 冒险 ,而 需 在 第 
4 条 指令 前 加 入 1 条 nop 指令 。 

(4) 数据 冒险 通过 硬件 阻塞 进行 处 理 时 ,如 不 采用 “转发 "来 执行 上 述 4 条 指令 , 则 需要 
时 钟 周期 数 为 14, 故 CPI 为 14/4=3.5。 若 采用 “转发 "来 执行 上 述 4 条 指令 , 则 需要 时 钟 周 
期 数 为 (5 一 1) 十 (4 十 1)=9, 故 CPI 为 9/4=2. 25。 

6. 下 面 是 一 段 MIPS 指令 序列 ， 
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add S$tl, $sl, $s0 
sub S$t2, $s0, $s3 
$t0, 0($t2) 

add $s0, $t0, $s2 
add $tl, $s0, $t2 


假定 在 一 个 采用 “ 取 指 、 译 码 / 取 数 \ 执 行 . 访 存 、 写 回 " 的 5 段 流 水 线 处 理 器 中 执行 上 述 
指令 序列 ,并 且 该 处 理 器 采用 了 “转发 "和 “load-use 冒险 处 理 ” 技 术 , 则 在 第 5 个 时 钟 周期 
内 ,各 指令 的 执行 情况 如 何 ? 哪些 寄存 器 的 内 容 正 在 被 读 ? 哪些 寄存 器 将 被 写 人 数据 ? 

【分 析 解 答 】 

在 一 个 如 图 6.4 所 示 的 带 “load-use 冒险 处 理 ” 和 “转发 "处理 的 5 段 流 水 线 数据 通路 中 
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执行 上 述 指令 序列 , 则 第 5 个 时 钟 周期 内 各 条 指令 的 执行 情况 如 下 。 

第 1 条 指令 在 写 回 (Wr) 段 ,寄存 器 $tl 将 被 写 人 。 

第 2 条 指令 在 访 存 (Mem) 段 ,sub 指令 进行 的 是 空 操作 ;在 转发 检测 单元 中 ,因为 流水 
段 寄 存 器 Ex/ Mem 中 的 目的 寄存 器 RegRd 为 $t2 ,流水 段 寄 存 器 ID/Ex 中 的 源 寄存 器 Rs 
也 为 $t2, 同 时 ,流水 段 寄 存 器 Ex/ Mem 中 的 RegWr 控制 信号 为 1, 所 以 检测 到 转发 条 件 满 
足 , 因 而 ,此 时 sub 指令 在 上 一 个 时 钟 周期 中 的 执行 结果 (在 流水 有 段 寄 存 器 Ex/Mem 中 的 
ALU 输出 结果 ) 正 被 回 送 到 ALU 的 输入 端 。 

第 3 条 指令 在 执行 (Ex) 段 ,ALU 正在 执行 add 操作 ,进行 地 址 运算 ,ALU 输出 结果 将 
被 写 人 流水 段 寄 存 器 Ex/Mem 中 。 

第 4 条 指令 在 译 码 / 取 数 (ID) 段 ,寄存 器 $t0 和 $s2 的 内 容 正 被 读 出 ;在 load-use 冒险 
检测 单元 中 ,因为 流水 段 寄 存 器 IF/ID 中 源 操 作 数 寄 存 器 Rs 为 $10, 流 水 段 寄存 器 ID/Ex 
中 目的 操作 数 寄存 器 Rt 也 为 $t0, 同 时 ,因为 上 条 指令 是 Ilw, 故 流水 段 寄 存 器 ID/Ex 中 的 
MemRead 控制 信号 为 1, 所 以 在 该 阶段 检测 到 load-use 冒险 条 件 满足 ,此 时 ,需要 进行 load- 
use 冒险 处 理 ,在 流水 线 中 插入 一 个 “气泡 ,将 指令 的 执行 阻塞 一 个 时 钟 周期 。 包 括 以 下 三 
个 步骤 : 四 将 流水 段 寄 存 器 ID/Ex 中 的 控制 信号 全 部 清 零 , 以 保证 第 4 条 指令 被 阻塞 一 个 
时 钟 周期 执行 ; 四 将 流水 段 寄 存 器 IF/ID 中 的 指令 维持 不 变 ,以 保证 第 4 条 指令 重新 译 码 
后 执行 ; @ 将 PC 的 值 维持 不 变 , 以 保证 根据 PC 的 值 重 新 取出 第 5 条 指令 。 

第 5 条 指令 在 取 指 (IF) 段 ,指令 正 被 读 出 ,将 要 送 到 流水 段 寄 存 器 IFVID 的 输入 端 。 因 
为 之 前 发 生 了 load-use 数据 冒险 ,所 以 该 指令 将 在 随后 的 第 6 个 时 钟 周期 内 重新 被 读 出 。 

7. 以 下 是 一 段 MIPS 指令 序列 ， 


loop: add $tl, $s3, $s3 
2 add $tl, $tl, $tl 
3 add $tl, $tl, $s6 
4 lw S$t0, 0($t1) 

§ bne S$t0, $s5, exit 
6 add $s3, $s3, $s4 
7 j loop 

8 


exit: 


假定 在 一 个 采用 “ 取 指 、 译 码 / 取 数 , 执 行 , 访 存 、 写 回 "的 5 段 流水 线 中 执行 上 述 指令 序 
列 ,该 流水 线 数据 通路 中 ,寄存 器 写 口 和 寄存 器 读 口 分 别 安排 在 一 个 时 钟 周期 的 前 、 后 半 个 
周期 内 独立 工作 。 要 求 回答 下 列 问 题 : 

(1) 哪些 指令 之 间 发 生 数据 相关 ? 哪些 指令 的 执行 会 发 生 控制 相关 ? 

(2) 如 果 不 采用 “转发 "技术 进行 数据 冒险 处 理 , 那 么 应 该 在 何 处 ,加 入 几 条 nop 指令 才 
能 避免 数据 冒险 ? 假定 采用 “转发 "技术 处 理 ,是 否 可 以 完全 解决 数据 冒险 ?不行 的 话 ,需要 
在 发 生 数 据 相关 的 指令 前 加 入 几 条 nop 指令 ,才能 使 这 段 指令 序列 的 执行 避免 数据 冒险 ? 

(3) 对 于 第 5 条 分 支 指令 引起 的 控制 冒险 (分 支 冒险 ) ,假定 检测 结果 是 否 为 “ 零 ” 并 更 
新 PC 的 操作 在 访 存 (Mem) 段 进行 , 则 分 支 延 迟 损失 时 间 片 ( 即 分 支 延 迟 槽 ) 为 多 少 ? 在 何 
处 .加 入 几 条 nop 指令 可 以 消除 分 支 冒险 ? 若 检测 结果 是 否 为 " 零 并 更 新 PC 的 操作 在 执 
行 (Ex) 段 进行 , 则 分 支 延迟 损失 时 间 片 ( 即 分 支 延 迟 槽 ) 为 多 少 ? 


(4) 对 于 第 7 条 指令 “j loop”, 假 定 更 新 PC 的 操作 在 “执行 (Ex)” 段 进行 , 则 流水 线 会 被 
阻塞 几 个 时 钟 周期 ? 需要 在 何 处 .加 入 几 条 nop 指令 才 可 消除 该 控制 冒险 ? 假定 更 新 PC 
的 操作 在 译 码 (ID) 段 进行 , 则 流水 线 又 将 被 阻塞 几 个 时 钟 周期 ? 

【分 析 解 答 】 

(1) 发 生 数据 相关 的 是 : 第 1 和 第 2 条 指令 之 间 关 于 $tl, 第 2 和 第 3 条 指令 之 间 关 于 
$tl ,第 3 和 第 4 条 指令 之 间 关 于 $tl, 第 4 和 第 5 条 指令 之 间 关 于 $t0, 以 及 第 6 和 第 1 条 
指令 之 间 关 于 $s3。 此 外 ,第 5 和 第 7 条 指令 的 执行 都 会 发 生 控制 相关 。 

(2) 对 于 数据 冒险 ,如 果 不 采 用 ”转发 ”而 是 简单 地 通过 加 入 nop 指令 来 避免 冒险 的 
话 , 那 么 应 该 在 第 2、3、4、5 条 指令 前 各 加 两 条 nop 指令 ,以 消除 数据 相关 ;对 于 第 6 条 和 第 
1 条 指令 之 间 的 数据 相关 , 则 可 通过 在 第 7 条 “j loop” 指 令 后 面 加 一 条 或 两 条 nop 指令 消除 
(这 样 同时 还 能 解决 第 7 条 “j loop” 指 令 的 控制 冒险 ); 为 解决 数据 冒险 , 共 需 加 13 或 14 条 
nop 指令 ,大 大 增加 了 程序 的 长 度 ,并 极 大 地 降低 了 指令 执行 效率 。 数 据 冒 险 在 多 数 情况 下 
可 通过 “转发 ”来 解决 ,此 处 ,第 2.3、4 条 指令 所 需 的 操作 数 可 通过 “转发 "得 到 ,无 须 加 nop 
指令 。 第 5 条 指令 所 需 的 操作 数 $t0 是 load-use 冒险 ,不 能 用 “转发 "解决 问题 ,需要 在 第 
5 条 指令 前 加 一 条 nop 指令 ,或 通过 硬件 将 第 5 条 指令 的 执行 阻塞 1 个 时 钟 周 期 。 

(3) 对 于 分 支 冒 险 , 若 检 测 结果 是 否 为 “ 零 ”并 更 新 PC 的 操作 在 访 存 (Mem) 段 进行 , 则 
分 支 延迟 损失 时 间 片 (分 支 延迟 槽 ) 为 3, 此 时 在 第 5 条 分 支 指令 后 加 3 条 nop 指令 ,或 从 硬 
件 上 使 分 支 指令 后 面 一 条 指令 的 执行 阻塞 3 个 时 钟 周期 。 若 检测 结果 是 否 为 * 零 ”并 更 新 
PC 的 操作 在 执行 (Ex) 段 进行 , 则 分 支 延迟 损失 时 间 片 (分 支 延 迟 模 ) 为 2。 

(4) 假定 loop” 指 令 更 新 PC 的 操作 在 执行 (Ex) 段 进行 , 则 流水 线 将 被 阻塞 2 个 时 钟 
周期 ,此 时 ,需要 在 jump 指令 后 加 2 条 nop 指令 才能 消除 该 控制 冒险 。 假 定 更 新 PC 的 操 
作 在 译 码 (ID) 段 进行 , 则 流水 线 只 被 阻塞 1 个 时 钟 周期 。 

8. 假定 有 一 个 程序 共 1000 条 指令 ,其 指令 序列 为 Iw, add,， lw, add, …。add 指令 仅 
依赖 它 前 面 的 lw 指令 ,而 lw 指令 也 仅 依赖 它 前 面 的 add 指令 。 寄 存 器 写 口 和 寄存 器 读 口 
分 别 在 一 个 时 钟 周 期 的 前 ,后 半 个 周期 内 独立 工作 。 请 回答 下 列 问 题 : 

(1) 在 带 转发 的 5 段 流 水 线 中 执行 该 程序 ,其 CPI 为 多 少 ? 

(2) 在 不 带 转 发 的 5 段 流水 线 中 执行 该 程序 ,其 CPI 为 多 少 ? 

【分 析 解 答 】 

(1) 若 流水 线 中 有 “转发 * 迎 辑 ,并 且 寄存 器 写 口 和 寄存 器 读 口 分 别 在 一 个 时 钟 周期 的 
前 、 后 半 个 周期 内 工作 , 则 只 存在 lw 指令 和 add 指令 之 间 的 一 个 load-use 数据 冒险 ,因此 ， 
每 个 lw 指令 和 add 指令 之 间 有 一 次 流水 线 阻塞 , 即 每 一 对 lw 和 add 指令 需要 用 3 个 时 钟 
周期 完成 ,因而 CPI 为 1.5。 

(2) 若 流水 线 中 没有 “转发 逻辑 ,而 寄存 器 写 口 和 寄存 器 读 口 分 别 在 一 个 时 钟 周期 的 
前 、 后 半 个 周期 内 工作 , 则 在 每 两 条 相 邻 指令 之 间 都 会 有 两 个 周期 的 阻塞 ,这 样 每 条 指令 相 
当 于 都 要 有 3 个 时 钟 周 期 才能 完成 ,因而 CPI 为 3。 

9. 假定 在 一 个 如 图 6.4 所 示 的 带 * 转 发 "功能 的 5 段 流水 线 中 执行 以 下 指令 序列 , 则 怎 
样 调整 以 下 指令 序列 才能 使 其 性 能 达到 最 好 ? 


日 lw $2, 100($6) 
芭 add $2, $2, $3 
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lw $3, 200($7) 
add $6, $4, $7 
$3, $4, $6 
lw $2, 300($8) 
beq $2, $8, Loop 


【分 析 解答 】 

因为 采用 “转发 "技术 ,所 以 ,只 要 对 load-use 数据 冒险 进行 指令 序列 调整 。 从 上 述 指令 
序列 来 看 ,第 1 和 第 2 条 指令 ,第 6 和 第 7 条 指令 之 间 存在 load-use 数据 冒险 ,所 以 ,可 将 与 
第 2 和 第 3 条 指令 无 关 的 第 4 条 指令 插入 第 2 条 指令 之 前 ;将 无 关 的 第 5 条 指令 插入 第 
7 条 指令 之 前 。 调 整 顺序 后 的 指令 序列 如 下 ( 粗 体 部 分 为 变换 了 位 置 的 指令 ) 。 


ww 
a 
5 


lw $2, 100($6) 
add $6, $4, $7 
add $2, $2, $3 
lw $3, 200($7) 
lw $2, 300($8) 
sub $3, $4, $6 
beq $2, $8, Loop 


10. 假设 将 分 支 指令 中 的 分 支 比较 操作 放 到 五 段 流水 线 的 译 码 / 取 数 (ID) 段 进行 , 那 
么 ,下 列 指令 序列 的 执行 过 程 中 ,哪些 数据 冒险 不 能 通过 “转发 "技术 解决 ? 


aowmb 三 


1 1w $1, 100($2) 
2 addi $1, $1,8 
3 beq $1, $3, 10 


【分 析 解 答 】 

如 图 6. 9 所 示 ,在 给 出 的 指令 序列 中 ,第 1 和 第 2 条 指令 之 间 的 load-use 数据 冒险 不 能 
通过 转发 技术 解决 。 对 于 第 2 和 第 3 条 指令 之 间 的 数据 冒险 ,如 果 分 支 比较 操作 在 执行 
(Ex) 段 以 后 进行 , 则 完全 可 以 将 第 2 条 指令 的 执行 结果 (在 Ex/Mem 流水 段 寄 存 器 中 ) 转 发 
给 在 执行 (Ex) 段 的 beq 指令 所 用 的 ALU 输入 端 , 但 是 ,如 果 beq 指令 在 ID 段 进 行 比较 操 
作 , 因 为 在 ID 段 的 beq 指令 需要 用 到 $1 的 值 时 ,第 2 条 addi 指令 还 没有 将 $1 的 值 在 
ALU 中 计算 出 来 ,因此 来 不 及 转发 ,因而 beq 指令 的 执行 需要 阻塞 一 个 时 钟 周期 。 

时 间 (时 钟 周 期 ) 














































































beq $1, $3, 10 














I | ID | Ex | Mem| Wr | 1 | | 
| 1 1 1 1 | 1 | 
| HD 1 1 | 1 | 

lw $1, 100($2) IM | Reg | Reg | | | | 
| 一 | 1 | 1 | 
1 1 1 | 1 | 
1 [ 1 | 1 | 
addi $1, $1, 8 | IM 1 DM 1 Reg I | | 
1 1 [L | 1 | 
| 1 | 1 | 
1 1 1 1 1 
| 1 | 
1 1 1 | 
1 1 1 1 
1 1 | 
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Cp DM Reg 
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图 6.9 题 10 中 的 图 示 








11. 假设 数据 通路 中 各 主要 功能 部 件 的 操作 时 间 为 : 存储 器 一 200ps,ALU 和 加 法 器 一 
100ps ,寄存 器 堆 读 口 或 写 口 一 50ps。 程 序 中 指令 的 组 成 比例 为 : 取 数 25%, 存 数 10%， 
ALU 类 52% ,分 支 11%, 跳 转 2%。 假 设 非 单 周期 处 理 器 时 的 时 钟 周期 取 存 储 器 存 取 时 间 
的 一 半 ,MUX .控制 单元 .PC 扩展 器 和 传输 线路 等 的 延迟 都 忽略 不 计 , 则 下 面 的 实现 方式 
中 ,哪个 最 快 ? 快 多 少 ? 

(1) 单 周期 方式 : 每 条 指令 在 一 个 固定 长 度 的 时 钟 周期 内 完成 。 

(2) 多 周期 方式 : 每 类 指令 时 钟 数 为 : 取 数 一 7, 存 数 一 6,ALU 一 5 ,分支 一 4, 跳 转 一 4。 

(3) 流水 线 方式 : 取 指 1、 取 指 2、 取 数 / 译 码 ,执行 . 存 取 1、 存 取 2、 写 回 7 段 流 水 线 ; 没 
有 结构 冒险 ;数据 冒险 采用 “转发 "技术 处 理 ;load 指令 与 后 续 各 指令 之 间 存 在 依赖 关系 的 
概率 分 别 1/2、1/4、1/8、… ;分 支 延 迟 损失 时 间 片 为 2, 预测 准确 率 为 75% ;不 考虑 异常 .中 
断 和 访问 缺失 引起 的 流水 线 冒 险 。 

【分 析 解 答 】 

(1) 单 周 期 方式 下 ,时 钟 周期 为 200 十 50 十 100 十 200 十 50 二 600ps, 故 一 条 指令 的 执行 时 
间 为 600ps。 

(2) 多 周期 方式 下 ,CPI==0.25X7 十 0. 10X6 十 0. 52X5 十 0. 11X4 十 0. 02X4=5. 47, 存 
储 器 操作 变 为 在 两 个 时 钟 周 期 内 完成 后 ,多 周期 数据 通路 的 时 钟 周 期 为 100ps, 故 平均 一 条 
指令 的 执行 时 间 为 100X5.47=547ps。 

(3) 流水 线 方式 下 ,存储 器 操作 变 为 在 两 个 时 钟 周期 内 完成 后 ,其 流水 线 包含 了 7 个 
阶段 。 

对 于 分 支 指令 , 若 预 测 正确 , 则 不 需 额 外 时 钟 周期 , 故 只 需 1 个 时 钟 周期 ; 若 预测 错误 ， 
则 因为 分 支 延迟 损失 时 间 片 为 2, 所 以 应 该 将 错误 预 取 的 2 条 指令 冲刷 掉 , 额 外 多 用 了 2 个 
时 钟 周期 ,因此 ,预测 错误 时 共 需 3 个 时 钟 周期 , 故 分 支 指令 的 CPI=0.25X3 十 0.75X1= 
1,5。 

对 于 load 指令 ,因为 一 个 存储 操作 占用 两 个 时 钟 周期 ,所 以 随后 第 1 条 指令 则 需 3 个 
(其 中 阻塞 2 个 ) 时 钟 周期 ;随后 第 二 条 指令 需 2 个 (其 中 阻塞 1 个 ) 时 钟 周期 ,以 后 的 指令 都 
不 需要 阻塞 , 故 CPI=1/2X3 十 1/4X2 十 2/8X1=2. 25。 

对 于 ALU 指令 ,随后 的 数据 相关 指令 都 可 通过 转发 解决 , 故 CPI=1。 

对 于 store 指令 ,不 会 发 生 数据 冒险 , 故 CPI= 1。 

对 于 jump 指令 ,最 快 也 要 在 译 码 阶段 才能 确定 转移 地 址 ,因此 需 阻 塞 2 个 时 钟 周期 ， 
加 上 本 身 一 个 时 钟 周期 , 共 3 个 时 钟 周期 , 故 CPI=3。 

因此 综合 CPI=0.25X2. 25 十 0. 10X1 十 0.52X1 十 0.11X1.5 十 0.02X3=1.41。 所 
以 ,平均 一 条 指令 的 执行 时 间 为 1. 41X100=141ps。 

由 上 述 分 析 可 知 ,流水 线 处 理 器 的 指令 执行 速度 最 快 , 是 单 周期 的 600/141s4. 26 售 ， 
是 多 周期 的 547/141s*3.844 倍 。 

12. 假设 一 段 程序 的 核心 模块 中 有 5 条 分 支 指令 ,该 模块 将 会 被 执行 成 千 上 万 次 ,在 其 
中 一 次 执行 过 程 中 ,5 条 分 支 指令 的 实际 执行 情况 如 下 (T: taken;N: not taken) 。 

分 支 指令 1(B1):T - T - T。 

分 支 指令 2(B2):N - N - N - N。 

分 支 指令 3(B3):T - N -T -N -T-N。 
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分 支 指令 4(B4); T=T-=-T=N= TT。 

分 支 指令 5(B5):T-T-N-T-T-N-T。 

假定 各 个 分 支 指令 在 每 次 模块 执行 过 程 中 实际 执行 情况 都 一 样 ,并 且 动 态 预测 时 ,每 个 
分 支 指令 都 有 各 自 的 预测 表 项 ,每 次 执行 时 的 初始 预测 位 都 相同 。 请 给 出 以 下 几 种 预测 方 
案 的 预测 准确 率 。 

(1) 静态 预测 ,总 是 预测 转移 (taken) 。 

(2) 静态 预测 ,总 是 预测 不 转移 (not taken) 。 

(3) 一 位 动态 预测 ,初始 预测 转移 (taken) 。 

(4) 两 位 动态 预测 ,初始 预测 弱 转移 (taken) 。 


【分 析 解 答 】 

预测 准确 率 == 预 测 正确 次 数 /总 预测 次 数 X100%。 以 下 R 表示 正确 预测 次 数 , W 表示 
错误 预测 次 数 。 

(1) B1: R-3, W-0;B2: R-0, W-4;B3: R-3, W-3;B4: R-4, W-1;B5: R-5, W-2。 预 测 
准确 率 60%% 。 

(2) B1: R-0, W-3;B2: R-4, W-0;B3: R-3, W-3;B4: R-1, W-4;B5: R-2, W-5。 预 测 
准确 率 40%。 


(3) 根据 主教 材 的 图 6. 21 所 示 的 状态 转换 图 ,可 以 得 到 各 分 支点 的 预测 情况 如 下 : 

Bl: R-3, W-0;B2: R-3, W-1;B3: R-1，W-5;B4: R-3, W-2;B5; R-3，W-4。 预 测 准 
确 率 52%。 

具体 每 次 的 预测 结果 如 图 6. 10 所 示 。 
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图 6.10 一 位 动态 预测 (初始 预测 为 转移 ) 的 预测 情况 








(4) 根据 主教 材 的 图 6. 23 所 示 的 状态 转换 图 ,可 以 得 到 各 分 支点 的 预测 情况 如 下 : 

Bl: R-3, W-0;B2: R-3, W-1;B3: R-3，W-3;B4: R-4，W-1;B5: R-5，W-2。 预 测 准 
确 率 72%。 

具体 每 次 的 预测 结果 如 图 6. 11 所 示 。 

13. 对 于 以 下 MIPS 指令 序列 : 


Loop: lw $2, 100($6) 
add $3, $2, $7 


骨 信 流水线 
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6.11 两 位 动态 预测 (初始 预测 为 弱 转移 ) 的 预测 情况 








SW $3, 100($6) 
lw $5, 200($6) 
sub $4, $5, $2 
Sw $4, 300($6) 
addi $6, $6,8 
bne $6, $8, Loop 


假定 在 一 个 如 图 6. 4 所 示 的 采用 “转发 "技术 的 5 段 流水 线 中 执行 上 述 循环 50 次 ,该 流 
水 线 数据 通路 中 ,寄存 器 写 口 和 寄存 器 读 口 分 别 被 安排 在 一 个 时 钟 周 期 的 前 、 后 半 个 周期 内 
独立 工作 ,分 支 指令 的 分 支 延迟 损失 时 间 片 为 3。 要 求 回 答 下 列 问题 ; 

(1) 不 采用 分 支 预测 时 ,每 次 循环 执行 需要 多 少时 钟 周 期 ? 

(2) 若 采用 静态 分 支 预测 ,并 总 是 预测 转移 (taken), 则 各 次 循环 执行 需要 多 少时 钟 周 
期 ? 总 的 执行 时 间 比 不 采用 分 支 预测 时 快 多 少 ? 

(3) 如 何 调整 指令 顺序 使 得 指令 序列 执行 时 流水 线 的 阻塞 次 数 最 少 ? 在 不 采用 分 支 预 
测 的 情况 下 ,指令 顺序 调整 后 总 的 执行 时 间 少 多 少 ? 在 采用 静态 预测 (总 是 预测 转移 ) 的 情 
况 下 ,指令 顺序 调整 后 总 的 执行 时 间 少 多 少 ? 

【分 析 解 答 】 

(1) 因为 循环 中 有 两 个 load-use 冒险 和 一 个 控制 (分 支 ) 冒 险 , 每 个 load-use 冒险 需要 
阻塞 一 个 时 钟 周期 ,而 分 支 指令 的 分 支 延迟 损失 时 间 片 为 3, 所 以 共有 2 十 3=5 次 阻塞 , 因 
而 每 次 循环 的 执行 共 需 8 十 5 二 13 个 时 钟 周期 。 

(2) 若 采 用 静态 分 支 预 测 , 并 总 是 预测 转移 , 则 前 面 49 次 循环 中 的 分 支 预测 都 能 成 功 ， 
因而 无 需 额外 的 时 钟 周期 , 故 一 次 循环 需 8 十 2= 10 个 时 钟 周期 ,而 最 后 1 次 循环 中 的 分 支 
预测 不 成 功 ,需要 在 流水 线 中 冲刷 掉 3 条 指令 , 故 最 后 一 次 循环 需 8 十 2 十 3 二 13 个 时 钟 周 
期 。 因 此 ,总 的 执行 时 间 为 49X10 十 1X13==503 个 时 钟 周期 。 不 采用 分 支 预测 时 总 的 执行 
时 间 为 50X13==650 个 时 钟 周期 。 所 以 两 者 相 比 ,采用 静态 预测 比 不 采用 分 支 预测 时 少 用 
了 (650 一 503) 二 147 个 时 钟 周期 。 

(3) 可 以 将 无 关 指令 插入 到 load-use 数据 相关 指令 之 间 , 调 整 指令 顺序 后 的 指令 序列 
如 下 。 
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Loop: lw $2, 100($6) 
lw $5, 200($6) 
add $3, $2, $7 
Sw $3, 100($6) 
sub $4, $5, $2 
Sw $4, 300($6) 
addi $6, $6,8 
bne $6, $8, Loop 


指令 顺序 调整 后 ,消除 了 load-use 数据 冒险 ,因而 ,在 不 采用 分 支 预测 的 情况 下 ,每 次 循 
环 需 8 十 3=11 个 时 钟 周期 , 共 11X50=550 个 时 钟 周期 。 比 调整 指令 顺序 前 少 了 650 一 
550 王 100 个 时 钟 周期 。 

指令 顺序 调整 后 ,在 采用 静态 预测 (总 是 预测 转移 ) 的 情况 下 ,前 49 次 每 次 循环 需 8 个 
时 钟 周期 ,最 后 1 次 预测 错误 , 需 在 流水 线 中 冲刷 3 条 指令 ,因而 需 8 十 3=11 个 时 钟 周期 ， 
共 需 49X8 十 1X11=403 个 时 钟 周期 ,与 调整 指令 顺序 前 相 比 ,总 的 执行 时 间 少 了 503 一 
403 王 100 个 时 钟 周期 。 

如 果 将 优化 指令 序列 并 采用 分 支 预测 的 情况 与 未 进行 指令 序列 优化 且 未 采用 分 支 预测 
的 情况 相 比 , 则 总 的 执行 时 间 少 了 650 一 403 二 247 个 时 钟 周期 。 

14. 某 高 级 语言 源 程序 中 的 一 个 while 语句 为 “while(save[ 订 ==k)i 十 =1;”, 若 对 其 
编译 时 ,编译 器 将 i 和 分别 分 配 在 寄存 器 $s3 和 $s5 中 ,数组 save 的 基 址 存放 在 $s6 中 ， 
则 生成 的 MIPS 汇编 代码 段 如 下 : 


EE loop: sll $t1l, $s3, 2 #R[$t1]<R[$s3]<<2,B RI$t1]=iX4 

2 add $tl1, $tl, $56 #R[$t1]<R[$t1]+R[$s6] ,Bp RI[$t1]=Address of 
#save [i] 

3 1w $t0, 0($t1) #R[$t0]<M[RI$t1]+0], 即 RI$t0]=save[i] 

4 bne $t0, $s5, exit #if R[$t0] R[$s5] then goto exit 

所 addi $s3, $s3,1 #R[$s3]<R[$s3]+1, 即 i=i+1 

6 | loop #goto loop 

. exits 


假定 如 图 6. 1 所 示 的 流水 线 数据 通路 中 各 主要 功能 单元 的 操作 时 间 为 : 存储 器 一 
200ps,ALU 和 加 法 器 一 100ps, 寄 存 器 堆 ( 读 或 写 ) 一 50ps。 请 回答 下 列 问题 

(1) 在 不 考虑 流水 段 寄 存 器 .多 路 选择 器 控制 单 元 .PC 扩展 器 和 线路 等 延迟 的 情况 
下 ,5 段 流水 线 处 理 器 的 最 小 时 钟 周 期 为 多 少 ? 

(2) 请 指出 循环 体 中 指令 之 间 的 数据 相关 性 。 

(3) 假定 采用 “转发 ”技术 ,并 对 分 支 冒险 采用 “一 位 动态 预测 "(初始 预 测 为 转移 ) 方 式 ， 
条 件 检测 和 分 支 目标 地 址 修改 都 在 执行 (Ex) 段 进行 ,jump 指令 在 译 码 (ID) 段 进行 跳 转 目 
标 地 址 修改 , 则 在 流水 线 处 理 器 上 执行 8 次 循环 所 用 的 时 间 为 多 少 纳 秒 ? 对 于 同样 的 8 次 
循环 执行 ,与 第 5 章 的 分 析 应 用 题 16 中 的 单 周 期 和 多 周期 处 理 器 相 比 ,流水 线 处 理 器 的 速 
度 快 了 多 少 倍 ? 

【分 析 解 答 】 

(1) 因为 最 复杂 的 部 件 (存储 器 ) 所 用 的 最 长 时 间 为 200ps, 所 以 ,在 不 考虑 流水 线 寄 存 


器 .多 路 选择 器 ,控制 单元 . PC、 扩展 器 和 线路 等 延迟 的 情况 下 ,5 段 流 水 线 处 理 器 的 最 小 时 
钟 周期 为 200ps。 

(2) 循环 体 中 第 1 和 2.2 和 3.3 和 4.5 和 1 条 指令 之 间 存 在 数据 相关 。 

(3) 采用 “转发 ”技术 可 以 消除 第 1 和 2、2 和 3、5 和 1 条 指令 之 间 的 数据 相关 ,但 不 能 
消除 第 3 和 4 条 指令 之 间 的 load-use 冒险 ,需要 额外 一 个 时 钟 的 阻塞 ,8 次 循环 共有 8 个 时 
钟 的 阻塞 ;此 外 ,对 于 bne 控制 (分 支 ) 冒 险 ,第 1 次 和 最 后 1 次 预测 错误 ,所 以 有 两 次 需要 对 
预 取 执行 的 指令 进行 冲刷 。 因 为 条 件 检测 和 转移 目标 地 址 修改 都 在 执行 (Ex) 段 进行 , 因 
此 ,分 支 延 迟 损失 时 间 片 (分 支 延 迟 槽 ) 为 2, 也 即 每 次 冲刷 掉 两 条 指令 。 因 此 ,两 次 共 被 冲 
刷 掉 4 条 指令 ,使 流水 线 阻塞 了 4 个 时 钟 周期 ;对 于 最 后 一 条 jump 指令 ,因为 在 译 码 (ID) 
段 进 行 跳 转 目标 地 址 修改 ,所 以 每 次 有 一 个 时 钟 阻塞 ,8 次 循环 jump 指令 共 执行 了 ?7 次 , 因 
而 有 7 个 时 钟 周期 的 阻塞 。 综 上 可 知 ,8 次 循环 总 共有 8 十 4 十 7 二 19 次 阻塞 , 且 第 1 一 4 条 
指令 各 执行 了 8 次 ,第 5.6 条 指令 各 执行 了 7 次 ,因此 ,8 次 循环 所 用 的 时 钟 周期 数 为 4X 
8 十 2X7 十 19 一 65 ,总 共 时 间 为 65X200ps==13ns。 

与 第 5 章 的 分 析 应 用 题 16 中 的 单 周 期 处 理 器 相 比 ,该 流水 线 处 理 器 执行 上 述 程序 段 的 
速度 快 了 (27.6 一 13)/13s1. 12 倍 ;与 多 周期 处 理 器 相 比 , 快 了 (35. 4 一 13)/13s1.72 售 。 
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存储 器 分 层 体系 结构 


7.1 教学 目标 和 内 容 安排 


主要 教学 目标 : 使 学 生 掌握 构成 存储 器 分 层 体系 结构 的 几 类 存储 器 的 工作 原理 和 组 织 
形式 。 要 求学 生 深刻 理解 程序 访问 局 部 性 的 意义 ,学 会 利用 时 间 局 部 性 和 空间 局 部 性 编写 
高 效 的 程序 ;了 解 指令 执行 过 程 中 访问 指令 和 访问 数据 的 整个 过 程 ,以 及 存储 访问 过 程 中 硬 
件 和 软件 的 分 工 和 联系 ,并 深刻 理解 提高 各 种 访问 命中 率 的 意义 ;了 解 虚拟 存储 管理 的 必要 
性 和 实现 思路 ,为 学 习 操作 系统 中 的 存储 管理 等 内 容 打 下 坚实 基础 。 

基本 学 习 要 求 ， 

(1) 了 解 存 储 器 的 各 种 分 类 方式 。 

(2) 掌握 如 何 构建 存储 器 的 层次 化 结构 。 

(3) 深刻 理解 程序 访问 的 局 部 化 特性 。 

(4) 熟悉 主 存储 器 的 基本 逻辑 结构 。 

(5) 了 解 SRAM 和 DRAM 芯片 的 内 部 结构 。 

(6) 了 解 半 导体 随机 存 取 存 储 器 的 组 织 方式 。 

(7) 了 解 各 种 只 读 存储 器 的 特点 。 

(8) 掌握 存储 器 芯片 扩展 技术 及 其 与 CPU 的 连接 方式 。 

(9) 了 解 加 快 存储 访问 速度 的 几 种 措施 。 

(10) 了 解 多 体 交叉 编 址 存储 器 的 基本 原理 。 

(11) 掌握 cache 的 基本 原理 与 实现 方式 ,包括 映射 方式 、 替 换算 法 、 写 策略 等 。 

(12) 理解 为 何 采用 虚拟 存储 管理 方式 。 

(13) 理解 什么 是 虚拟 地 址 和 虚拟 地 址 空间 。 

(14) 掌握 虚拟 地 址 向 物理 地 址 转换 的 基本 原理 与 实现 技术 。 

(15) 了 解 页 表 的 功能 和 页 表 项 的 内 容 。 

(16) 了 解 “ 缺 页 ”异常 的 发 现 和 处 理 过 程 。 

(17) 掌握 TLB( 快 表 ) 的 结构 和 实现 技术 。 

(18) 掌握 一 次 存储 访问 的 全 过 程 ,并 深刻 理解 在 此 过 程 中 硬件 与 软件 之 间 的 分 工 协作 

本 章 主要 包含 3 个 核心 内 容 : 半导体 随机 访问 存储 器 .cache 和 虚拟 存储 器 ,并 阐述 了 
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如 何以 这 3 个 核心 内 容 为 基础 ,构建 存储 器 的 层次 化 体系 结构 框架 。 

对 于 半导体 随机 访问 存储 器 ,可 以 按照 记忆 单元 ~ 存储 阵列 一 存储 器 芯片 一 存储 模块 
(内 存 条 ) 一 存储 器 ”的 顺序 ,采用 由 点 到 面 的 组 织 方式 ,着 重 讲 清楚 SRAM 和 DRAM 两 类 
存储 器 的 结构 特点 和 用 途 , 以 及 存储 芯片 的 扩展 和 连接 技术 。 有 关 存 储 芯 片 的 扩展 和 连接 
技术 方面 的 知识 有 助 于 对 总 线 .数据 的 存放 顺序 和 对 齐 方式 等 许多 概念 的 理解 ,同步 动态 存 
储 器 (SDRAM 芯片 ) 的 概念 与 后 面 有 关 总 线 设计 、 系 统 互 连 等 内 容 相关 。 在 课时 受 限 的 情 
襄 下 ,对 于 记忆 单元 的 存储 和 读 写 原理 、 存 储 芯 片 的 读 写 周 期 DRAM 的 刷新 、 只 读 存储 器 
等 内 容 只 要 概要 说 明 一 下 即 可 ,因为 这 些 不 属于 主干 内 容 , 也 比较 独立 ,对 其 他 内 容 的 学 习 
影响 不 大 。 

对 于 cache, 首 先 , 应 着 重 讲 清楚 程序 访问 的 局 部 性 ,因为 程序 的 时 间 局 部 性 和 空间 局 部 
性 是 提出 并 实现 cache 的 基础 ,对 这 些 内 容 的 深刻 理解 ,也 有 助 于 编写 高 效 的 程序 。 通 过 具 
体 程序 示例 ,可 以 将 程序 访问 的 局 部 性 特点 讲 深 讲 透 。cache 和 主 存 之 间 的 映射 关系 可 能 
是 难点 部 分 ,主教 材 中 例 7.4、 例 7.6 和 例 7.7 是 针对 相同 主 存 大 小 和 相同 cache 行 数 的 三 
种 不 同 映射 关系 的 例子 ,课堂 教学 中 ,可 以 直接 通过 这 三 个 例子 来 说 明 不 同 的 映射 关系 ,使 
得 学 生 能 够 较 快 地 掌握 不 同 映射 关系 的 不 同 实 现 方式 和 访 存 过 程 。 对 于 主教 材 中 的 
例 7.9, 可 通过 详细 讲解 几 个 关键 单元 (如 第 0.1.63 .64 等 单元 ) 的 访问 ,使 学 生 能 够 深入 了 
解 CPU 的 访 存 过 程 和 替换 算法 。 如 果 课 时 受 限 ,cache 性 能 评估 、 影 响 cache 性 能 的 因素 以 
及 cache 结构 举例 等 内 容 可 以 跳 过 或 仅 作 简单 讲解 。 

对 于 虚拟 存储 器 ,着 重 讲 清楚 请 求 分 页 的 思想 .虚拟 地 址 空间 的 概念 ,页 表 的 结构 ,地址 
转换 过 程 和 快 表 的 概念 。 主 教材 中 图 7.43 和 图 7. 44 反映 了 CPU 进行 一 次 存储 访问 的 过 
程 ,结合 对 这 两 张 图 的 讲解 和 对 主教 材 中 表 7. 1 的 解读 ,可 以 加 深 学 生 对 CPU 访 存 过 程 的 
理解 ,特别 是 加 深 对 软件 和 硬件 分 工 协作 过 程 的 了 解 ,从 而 加 深 对 完整 的 存储 器 层次 化 结构 
体系 的 理解 。 如 果 课 时 受 限 ,有 关 进 程 与 进程 的 上 下 文 .存储 器 管理 概述 、 存 储 保护 等 可 跳 
过 或 仅 作 简 单 讲解 。 


7.2 主要 内 容 提要 


1. 存储 器 的 分 类 

存储 器 按 存 取 方 式 分 为 随机 存 取 存储 器 \ 顺 序 存 取 存储 器 、 直 接 存 取 存 储 器 和 相 联 存 取 
存储 器 ; 按 存储 介质 分 为 半导体 存储 器 、 磁 表面 存储 器 和 光盘 存储 器 ; 按 信息 可 更 改 性 分 为 
可 读 可 写 和 只 读 存储 器 ; 按 断 电 后 可 否 保 存 分 为 易 失 性 和 非 易 失 性 存储 器 ; 按 功 能 、 容 量 、 速 
度 三 个 方面 分 为 寄存 器 cache、 主 存储 器 (内 存 ) ,辅助 存储 器 (外 存 ) 和 海量 后 备 存储 器 。 

2. 存储 器 的 分 层 结构 

因为 每 一 种 单独 的 存储 器 都 不 是 又 快 、 又 大 、 又 便宜 ,为 了 构建 这 种 理想 的 存储 器 系统 ， 
计算 机 中 采用 了 一 种 层次 化 的 存储 器 体系 结构 。 按 照 速度 从 快 到 慢 、 容 量 从 小 到 大 ,价格 从 
高 到 低 的 顺序 ,由 近 到 远 地 将 不 同 存储 器 设置 在 离 CPU 远近 不 同 的 地 方 ,这 样 的 顺序 是 寄 
存 器 习 cache 习 主 存 习 SSD 或 磁盘 一 光盘 和 磁带 。 

3. 半导体 随机 存 取 存储 器 的 组 织 

主 存 空 间 的 RAM(Random Access Memory) 区 由 若干 内 存 条 组 成 ,每 个 内 存 条 上 有 车 
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干 存储 器 芯片 ,存储 器 芯片 由 用 于 存储 信息 的 存储 阵列 外 加 地 址 缓存 器 、 地 址 译 码 器 、 读 写 
控制 电路 等 组 成 ,每 个 存储 阵列 由 若干 行 和 若干 列 构成 ,每 个 行 、 列 交叉 处 是 一 个 记忆 单元 
(存储 元 ) ,每 个 记忆 单元 用 来 存储 一 位 二 进位 0 或 1。 根据 记忆 单元 结构 的 不 同 分 为 
SRAM 芯片 和 DRAM 芯片 两 种 ,SRAM 芯片 的 记忆 单元 采用 6 管 静态 MOS 管 存储 电路 ， 
其 功 耗 大 ,集成 度 低 ,但 速度 快 ,无 须 再 生 和 刷新 ,适合 构 作 高 速 小 容量 的 存储 器 ,如 cache; 
DRAM 芯片 的 记忆 单元 采用 单 管 动态 MOS 管 存储 电路 ,因为 只 用 一 个 MOS 管 ,所 以 功 耗 
小 ,集成 度 高 ,但 由 于 靠 电容 储存 电荷 和 充 放 电 来 存储 和 读 写 信息 ,所 以 速度 慢 ,并 需 定时 刷 
新 ,适合 构 作 慢 速 大 容量 的 存储 器 ,如 主 存 。 

4. 只 读 存储 器 

只 读 存储 器 (Read Only Memory,ROM) 中 的 信息 用 特殊 方式 写 入 ,一 经 写 人 ,就 可 长 
久保 存 ,是 非 易 失 性 存储 器 。 其 存 取 方 式 也 是 随机 存 取 。 只 读 存储 器 主要 用 于 存放 固定 信 
息 ,如 微 程序 ,BIOS、 引导 程序 或 通信 式 系统 中 固化 的 程序 和 数据 等 。 只 读 存 储 器 有 
MROM PROM .EPROM EEPROM Flash ROM 等 几 种 类 型 。 ROM 区 也 属于 内 存 空间 
的 一 部 分 。 

S. 存储 器 芯片 及 其 与 CPU 的 连接 

RAM 芯片 分 为 字 片 式 和 位 片 式 两 种 。 通 常 DRAM 芯片 都 是 位 片 式 ,DRAM 芯片 采用 
多 个 位 平面 构成 ,每 个 位 平面 是 一 个 二 维 的 存储 阵列 。DRAM 芯片 中 的 行 地 址 和 列 地 址 共 
用 同一 组 地 址 引 脚 , 称 为 行列 地 址 线 复 用 。 为 提高 存储 器 芯片 的 读 写 速度 ,DRAM 芯片 内 
通常 会 有 一 个 用 SRAM 实现 的 行 缓存 (row buffer) 。 

存储 器 芯片 和 CPU 之 间 通 过 总 线 相连 ,总线 中 包括 地 址 线 、 数 据 线 和 控制 线 。 地 址 线 
的 连接 需要 考虑 芯片 在 字 方 向 上 的 扩展 ,采用 芯片 内 连续 编 址 方式 时 ,地 址 的 低位 用 于 芯片 
内 地 址 ,高 位 用 于 片 选 逻辑 , 片 选 信号 译 码 器 的 输出 连 到 芯片 的 片 选 信号 引 脚 上 ;车 采用 交 
叉 编 址 方式 时 ,地 址 的 高 位 用 于 芯片 内 寻 址 ,低位 部 分 用 于 片 选 池 辑 。 数 据 线 的 连接 需要 考 
虑 芯片 在 位 方向 上 的 扩展 ,分 别 连 到 位 扩展 的 芯片 上 ;控制 线 的 连接 ,包括 读 写 信号 . 主 存 或 
I/O 访问 信号 等 。 

6. 主 存 的 主要 技术 指标 

主 存 的 主要 技术 指标 包括 存储 容量 、 存 取 时 间 、 存 储 周期 和 存储 器 带宽 。 存 储 容量 是 指 
某 计算 机 实际 配置 的 容量 ,通常 , 它 小 于 最 大 可 配置 容量 ( 主 存 地 址 空间 大 小 ); 存 取 时 间 指 
执行 一 次 读 操作 或 写 操作 的 时 间 ,分 读 出 时 间 和 写 人 时 间 两 种 ;存储 周期 指 存储 器 进行 连续 
两 次 独立 的 读 或 写 操作 所 需 的 最 小 时 间 间 隔 , 它 通常 大 于 存 取 时 间 ;存储 器 带宽 指 单位 时 间 
内 从 存储 器 读 出 或 写 人 存储 器 的 最 大 信息 量 。 

7. 多 模块 存储 器 

采用 多 模块 存储 器 的 目的 是 为 了 提高 访 存 速度 ,通过 使 多 个 存储 模块 并 行 工 作 可 以 达 
到 目的 。 为 使 多 个 模块 并 行 工作 ,每 个 模块 除了 有 各 自 独立 的 存储 阵列 以 外 ,还 必须 有 独立 
的 地 址 缓存 器 数据 缓存 器 、. 地 址 译 码 器 和 读 写 控制 电路 等 。 

多 模块 存储 器 有 连续 编 址 和 交叉 编 址 两 种 组 织 方式 。 连 续 编 址 方式 下 , 按 高 位 地 址 划 
分 模块 ,地 址 在 一 个 存储 模块 内 连续 编号 ,因此 同一 个 访 存 请 求 内 的 信息 在 同一 个 模块 中 ， 
无 法 并 行 。 只 有 同时 有 多 个 访 存 请 求 时 才能 并 行 ;交叉 编 址 方式 下 , 按 低位 地 址 划分 模块 ， 
地 址 在 所 有 存储 模块 之 间 交 叉 编 号 ,因此 同一 个 访 存 请 求 内 的 信息 分 布 在 不 同 模块 中 ,可 并 
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行 访问 所 有 模块 ,因而 可 加 快 访问 速度 。 

8. 高 速 缓存 (cache) 

cache 是 在 CPU 的 寄存 器 和 主 存 之 间 设 置 的 高 速 小 容量 的 存储 器 。 引 入 cache 的 目的 
是 为 了 提高 访 存 速度 。 与 多 模块 存储 器 通过 并 行 来 提高 速度 不 同 ,cache 之 所 以 能 提高 速 
度 , 是 因为 程序 执行 时 代码 和 数据 的 存储 访问 具有 局 部 性 特点 。 程 序 访问 的 局 部 性 特点 体 
现在 两 个 方面 : 时 间 局 部 性 和 空间 局 部 性 。 时 间 局 部 性 指 某 个 单元 在 一 个 很 短 的 时 间 段 内 
被 重复 访问 的 可 能 性 很 大 ;空间 局 部 性 指 某 个 单元 被 访问 后 其 周围 单元 不 久 也 将 被 访问 的 
可 能 性 很 大 。 这 样 ,只 要 将 刚 被 访问 的 单元 及 其 邻近 单元 一 起 复制 到 cache 中 ,那么 ,在 最 
近 一 段 时 间 内 CPU 访问 的 信息 都 可 以 在 cache 中 访问 到 ,而 不 需要 访问 慢 速 的 主 存 。 

实现 cache 时 需要 解决 一 系列 问题 ,例如 ,将 主 存 中 的 一 个 局 部 信息 块 装 入 cache 时 , 信 
息 块 大 小 多 大 ? 装 入 到 cache 的 何 处 ? CPU 如 何 根 据 主 存 地 址 找到 cache 中 相应 的 信息 ? 
cache 装 满 的 情况 下 又 要 复制 新 的 主 存 块 到 cache 时 ,原来 在 cache 中 的 哪些 主 存 块 应 被 替 
换 出 来 ? 写 信息 时 如 何 保 证 主 存 中 和 cache 中 的 同一 个 信息 块 完全 一 致 ? 

1) cache 和 主 存 间 的 映射 关系 

将 主 存 地 址 空间 划分 成 大 小 相等 的 信息 块 ,从 0 开始 给 每 个 块 编号 。cache 由 若干 行 组 
成 ,每 一 行 中 有 一 个 用 于 存放 主 存 块 的 槽 ,其 大 小 与 主 存 块 大 小 一 样 ,cache 行 也 从 0 开始 纺 
号 。 在 将 主 存 块 复制 到 cache 行 中 时 , 主 存 块 号 和 cache 行 号 之 间 可 采用 直接 映射 .全 相 联 
映射 和 组 相 联 映射 三 种 映射 关系 。 

直接 映射 时 ,每 个 主 存 块 对 应 一 个 固定 的 cache 行 ,其 映射 关系 为 : cache 行 号 = 主 存 
块 号 mod cache 行 数 。 此 时 , 主 存 地 址 划分 为 标记 、cache 行 号 ( 行 索引 ) 和 块 内 地 址 三 个 字 
段 ;全 相 联 映射 时 ,每 个 主 存 块 可 复制 到 任何 一 个 cache 行 中 , 主 存 地 址 划分 为 标记 和 块 内 
地 址 两 个 字段 ;组 相 联 映射 时 ,cache 分 若干 组 ,每 组 有 多 行 ,各 主 存 块 存放 到 固定 组 的 任意 
行 中 ,其 映射 关系 为 : cache 组 号 = 主 存 块 号 mod cache 组 数 , 主 存 地 址 划分 为 标记 cache 
组 号 (组 索引 ) 和 块 内 地 址 三 个 字段 。 

2) CPU 访 存 过 程 

CPU 给 出 主 存 地 址 后 ,首先 根据 映射 方式 对 主 存 地 址 进行 划分 ,根据 行 索引 或 组 索引 
的 值 ,确定 将 主 存 地 址 高 位 上 的 标记 字段 与 哪些 cache 行 中 的 标记 进行 比较 。 显 然 ,对 于 直 
接 映 射 ,只 需 比较 一 个 cache 行 ;对 于 全 相 联 映射 , 则 需 与 所 有 行进 行 比 较 ;对 于 组 相 联 映 
射 , 则 与 组 内 所 有 行 比较 。 若 存在 某 个 cache 行 中 的 标记 与 主 存 地 址 中 的 标记 字段 相等 ,并 
且 该 行 中 的 有 效 位 为 1, 则 访问 命中 ,此 时 ,根据 主 存 地 址 中 低位 上 的 块 内 地 址 访问 该 行 中 
相应 的 信息 ;车 所 有 行 中 的 标记 都 不 等 于 主 存 地 址 中 的 标记 字段 ,或 有 相等 的 行 但 对 应 的 有 
效 位 为 0, 则 访问 不 命中 (缺失 ) ,此 时 ,需要 将 该 主 存 地 址 所 在 的 块 从 主 存 取 到 cache, 并 根 
据 主 存 块 的 位 置 在 cache 行 中 置 标记 , 且 置 有 效 位 为 1。 

3) 替换 算法 

当 需 要 调和 一 个 新 的 主 存 块 而 对 应 的 cache 行 全 满 时 ,需要 将 这 些 cache 行 中 某 个 主 存 
块 替换 出 来 。 常 用 的 替换 算法 有 先进 先 出 (FIFO) ,最 近 最 少 用 (LRU) 等 。FIFO 算法 的 基 
本 思想 是 ,总 是 把 最 先 调 到 cache 的 那个 主 存 块 淘汰 掉 ;LRU 算法 的 基本 思想 是 ,总 是 把 最 
近 最 少 用 到 的 那个 主 存 块 淘汰 掉 。 
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4) 写 策略 (一 致 性 问题 ) 

CPU 执行 写 操作 时 ,为 了 保证 主 存 和 cache 中 的 同一 个 主 存 块 的 一 致 性 ,可 采用 回 写 
法 (write back) 和 全 写法 (write through) 两 种 写 策略 。 回 写法 的 基本 思想 是 ,暂时 只 写 
cache, 替 换 时 一 次 性 将 cache 中 的 主 存 块 写 回 主 存 ;全 写法 的 基本 思想 是 ,每 次 写 cache 的 
同时 也 写 主 存 , 为 了 加 快 写 的 过 程 ,可 在 cache 和 主 存 间 加 一 个 写 缓存 (write buffer) 。 

当 写 不 命中 时 ,有 写 分 配 法 (write allocate) 和 非 写 分 配 法 (not write allocate) 两 种 方 
式 。 采 用 写 分 配 法 时 ,需要 分 配 一 个 cache 空 行 ,以 将 主 存 块 复制 到 cache; 采 用 非 写 分 配 法 
时 ,不 将 主 存 块 复制 到 cache。 因 此 , 回 写 策略 下 ,一 定 采用 写 分 配 法 ,而 全 写 策略 下 ,两 种 分 
配方 式 都 可 以 采用 。 

5) 主 存 块 大 小 的 选择 

主 存 块 大 小 是 主 存 和 cache 之 间 进 行 信 息 交换 的 基本 单位 , 主 存 块 大 小 与 命中 率 和 缺 
失 损失 关系 极 大 ,因而 块 大 小 的 选择 非常 重要 。 主 存 块 太 小 , 则 不 能 很 好 地 利用 空间 局 部 
性 ,进而 影响 命中 率 ; 主 存 块 太 大 , 则 增加 主 存 块 的 读 取 时 间 , 即 缺失 损失 变 大 ,而 且 , 由 于 块 
变 大 ,使 得 cache 行 数 减少 ,映射 到 同一 个 cache 行 的 主 存 块 数 增加 ,进而 会 使 缺失 率 上 升 。 

9. 虚拟 存储 器 

虚拟 存储 管理 是 现代 计算 机 系统 中 普遍 采用 的 存储 管理 方式 。 在 采用 虚拟 存储 管理 的 
计算 机 系统 中 ,每 个 进程 具有 一 个 一 致 的 , 极 大 的 .私有 的 虚拟 地 址 空间 ,虚拟 地 址 空间 按 等 
长 的 页 来 划分 , 主 存 也 按 等 长 的 页 框 划 分 。 进 程 执行 时 将 当前 用 到 的 页 面 装 入 主 存 ,其 他 暂 
时 不 用 的 部 分 放 在 磁盘 上 ,通过 页 表 建 立 虚拟 页 和 主 存 页 框 之 间 的 对 应 关系 。 对 于 不 在 主 
存 的 页 面 ,在 页 表 中 记录 其 在 磁盘 上 的 地 址 。 在 指令 执行 过 程 中 ,由 特殊 的 硬件 MMU 进 
行 地 址 转换 ,从 而 实现 存储 访问 。 

虚拟 存储 器 的 实现 方式 有 分 页 式 、 分 段 式 和 段 页 式 3 种 。CPU 执行 指令 时 ,通过 指令 
寻 址 方式 计算 得 到 的 有 效 地 址 通常 是 一 个 虚拟 地 址 ( 即 逻辑 地 址 )。CPU 中 的 地 址 转换 部 
件 根据 虚拟 地 址 中 的 虚 页 号 找到 对 应 的 页 表 项 ,然后 通过 页 表 项 得 到 该 虚 页 号 对 应 的 页 框 
号 ( 即 物理 页 号 . 实 页 号 ) ,最 后 将 它 和 页 内 地 址 拼接 得 到 物理 地 址 ( 即 主 存 地 址 .实地 址 ) 。 

每 个 进程 有 一 个 页 表 , 每 个 页 表 项 由 有 效 ( 装 入 ) 位 、 使 用 位 、 修 改 位 、. 存 取 权限 位 、 主 存 
页 框 号 或 磁盘 地 址 等 组 成 。 在 地 址 转换 过 程 中 , 若 对 应 页 表 项 中 的 有 效 位 为 0, 则 说 明 该 页 
面 不 在 主 存 中 , 即 “ 缺 页 ”, 此 时 ,CPU 调 出 操作 系统 的 缺 页 处 理 程序 执行 ,该 程序 从 磁盘 读 
人 所 需 页 面 到 主 存 , 并 修改 页 表 。 缺 页 处 理 后 ,必须 回 到 原来 发 生 缺 页 的 指令 重新 执行 。 

为 了 减少 从 主 存 访问 页 表 的 次 数 ,通常 将 常用 页 表 项 放 在 CPU 的 一 个 高 速 缓存 中 ,这 
个 高 速 缓存 被 称 为 TLB( 快 表 ) 。 

可 以 利用 虚拟 存储 管理 机 制 进行 存储 保护 ,主要 有 地 址 越界 和 访问 越权 两 种 内 存 保护 
错误 ,通常 称 为 访问 违例 或 存储 器 访问 异常 。 


7.3 基本 术语 解释 


随机 访问 存储 器 (Random Access Memory, RAM) 
根据 地 址 译 码 结果 选择 某 个 单元 进行 读 写 , 对 于 一 个 存储 器 芯片 来 说 ,所 有 单元 的 地 址 
位 数 一 样 ,所 以 每 个 单元 的 地 址 译 码 所 用 时 间 一 样 。 从 这 个 角度 来 说 ,这 种 存储 器 中 每 个 单 
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元 的 存 取 时 间 与 存储 单元 的 物理 位 置 无 关 。 

相 联 存储 器 (Associate memory,Content Addressed Memory,CAM) 

已 知 要 访问 信息 的 部 分 内 容 , 通 过 比较 找到 需 访 问 信息 的 位 置 ,然后 读 写 信息 ,如 全 相 
联 cache。 相 联 存储 器 的 特点 就 是 按 内 容 访问 ,而 不 是 像 RAM 或 ROM 那样 按 地 址 访问 。 

静态 随机 访问 存储 器 (Static RAM. SRAM) 

靠 触 发 器 的 双 稳 态 的 正 负 反馈 电路 存储 信息 ,因而 速度 快 ,是 非 破坏 性 读 出 ,但 电路 中 
元 器 件 多 ,因而 集成 度 小 ,适合 做 高 速 小 容量 的 高 速 缓 冲 存储 器 (cache) 。 

动态 随机 访问 存储 器 (Dynamic RAM, DRAM) 

靠 电容 存 储 电荷 来 保存 信息 。 若 电容 上 存 有 足够 多 的 电荷 表示 存 1, 电 容 上 无 电荷 表 
示 存 0。 是 破坏 性 读 出 , 读 后 需 要 再 生 ,而 且 需 要 定时 刷新 。 

刷新 (refresh) 

DRAM 芯片 中 ,MOS 管 机 极 电 容 会 逐渐 放电 ,只 能 维持 几 到 几 十 毫秒 ,因此 ,即使 电源 
不 掉 电 , 电 荷 也 会 自动 消失 。 所 以 需要 定时 对 所 有 存储 单元 进行 充 / 放 电 , 以 恢复 原来 的 电 
荷 ,这 个 过 程 称 为 刷新 。 

易 失 性 存储 器 (volatile memory) 

电源 掉 电 后 ,存储 器 中 的 信息 全 部 消失 ,如 cache、RAM 等 。 

非 易 失 性 存储 器 (nonvolatile memory) 

存储 器 中 的 信息 不 会 因为 电源 掉 电 而 消失 ,如 ROM 磁盘. 光 盘 、 闪 存 (Flash 存储 
器 ) 等 。 

记忆 单元 (memory cell) 

也 称 为 存储 基 元 ,存储 元 。 具 有 两 种 稳 态 的 能 够 表示 二 进 制 数 码 0 和 1 的 物理 器 件 ,一 
个 记忆 单元 表示 1 位 信息 。 

存储 单元 (memory unit) 

主 存 中 具有 相同 地 址 的 那些 位 构成 一 个 存储 单元 。 因 此 ,存储 单元 的 宽度 等 于 一 个 编 
址 单位 的 长 度 ,可 以 是 8 位 、16 位 、32 位 等 。 现 在 ,大 多 数 计算 机 是 按 字 节 编 址 的 , 即 每 一 个 
字 节 (8 位 ) 有 一 个 地 址 , 编 址 单位 就 是 一 个 字 节 ,所 以 一 个 存储 单元 的 宽度 是 8 位 。 

存储 器 地 址 寄存 器 (Memory Address Register, MAR) 

CPU 中 用 来 存放 存储 器 地 址 的 寄存 器 。 地 址 在 送 到 存储 器 总 线 的 地 址 线 之 前 , 先 寄 存 
在 MAR 中 。 因 此 , 它 的 宽度 应 该 等 于 地 址 线 的 宽度 ,也 等 于 主 存 地 址 位 数 ,其 值 决定 了 主 
存 最 大 的 寻 址 空间 。 

存储 器 数据 寄存 器 (Memory Data Register, MDR) 

CPU 中 用 来 存放 写 入 主 存 或 从 主 存 读 出 的 数据 的 寄存 器 ,数据 在 送 到 存储 器 总 线 的 数 
据 线 之 前 ,或 从 主 存 读 到 CPU 时 ,都 先 寄存 在 MDR 中 。 因 此 , 它 的 宽度 应 该 等 于 数据 线 的 
宽度 。 

存 取 时 间 (access time) 

执行 一 次 读 操作 或 写 操作 的 时 间 ,分 读 出 时 间 和 写 人 时 间 。 读 出 时 间 为 从 主 存 接收 到 
有 效 地 址 开始 到 数据 取出 有 效 为 止 的 时 间 , 写 人 时 间 是 从 主 存 接收 到 有 效 地 址 开始 到 数据 
写 人 被 写 单元 为 止 的 时 间 。 
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存储 周期 (memory cycle time) 

存储 器 进行 连续 两 次 独立 的 读 或 写 操作 所 需 的 最 小 时 间 间 隔 。 

存储 器 带宽 (bandwidth) 

每 秒 钟 从 存储 器 进 /出 信息 的 最 大 数量 。 假 设 存 储 周期 为 50ns, 每 个 存储 周期 最 多 可 
存 取 64 位 数据 , 则 带宽 为 1. 28Gb/s。 通 常 存储 器 被 组 织 成 多 模块 存储 器 ,能 够 多 个 模块 同 
时 进行 读 写 ,因而 存储 器 带宽 为 一 个 存储 模块 带宽 的 若干 倍 。 

片 选 信号 (chip select signal) 

一 个 存储 芯片 的 容量 往往 满足 不 了 计算 机 对 存储 容量 的 要 求 ,所 以 需要 将 一 定数 量 的 
芯片 按 一 定 方式 连接 成 一 个 完整 的 存储 器 。 在 访问 某 个 字 时 ,必须 * 选 中 ?该 字 所 在 的 芯片 ， 
而 其 他 芯片 不 被 “选中 ”, 控 制 芯片 是 否 被 选中 的 信号 即 片 选 信号 CS。 

地 址 引 脚 复 用 (address pin multiplexing) 

DRAM 芯片 采用 二 维 译 码 方式 ,为 了 减少 引 脚 个 数 ,把 行 地 址 和 列 地址 用 同一 组 地 址 
引 脚 线 分 时 进行 传送 。 靠 行 地 址 选 通信 号 和 列 地 址 选 通信 号 来 区 分 在 地 址 引 脚 线 上 传送 的 
是 行 地 址 还 是 列 地 址 。 

行 地址 选 通信 号 (Row Address Strobe, RAS) 

DRAM 芯片 中 , 行 地 址 选 通信 号 有 效 时 ,说 明 在 地 址 引 脚 线 上 传输 的 是 行 地 址 信和 号 。 

列 地 址 选 通信 号 (Column Address Strobe, CAS) 

DRAM 芯片 中 , 列 地 址 选 通信 号 有 效 时 ,说 明 在 地 址 引 脚 线 上 传输 的 是 列 地 址 信和 号 。 

只 读 存储 器 (Read Only Memory, ROM) 

这 种 存储 器 的 原始 信息 一 旦 被 写 信 ,在 程序 执行 过 程 中 ,只 能 对 其 内 容 进行 读 出 ,而 不 
能 写 人 。 只 读 存储 器 通常 用 来 存放 固定 不 变 的 信息 。 

掉 腊 ROM (mask ROM) 

由 厂家 在 生产 过 程 中 一 次 形成 的 ROM, 即 信息 已 经 完全 固化 在 芯片 中 ,无 法 修改 。 其 
结构 类 似 于 字 片 式 RAM, 没 有 写 和 机构。 这 类 ROM 适合 于 大 批量 生产 。 

PROM(Programmable ROM) 

可 编程 只 读 存 储 器 ,在 使 用 时 由 使 用 者 专门 一 次 写 入 ,以 后 再 也 不 能 改变 。 

EPROM (Erasable PROM) 

可 擦 除 可 编程 只 读 存储 器 ,可 以 用 特殊 的 装置 反复 擦 除 和 重 写 。 一 般 将 芯片 放 在 紫外 
线 下 照射 15 一 20min ,使 信息 全 部 控 除 。 

EEPROM(Electrically EPROM) 

电 可 擦 除 可 编程 只 读 存 储 器 ,使 用 电 可 擦 除 技 术 ( 加 高 电压 擦 除 ) ,可 擦 除 个 别 单元 。 写 
操作 比 读 操作 花 更 多 的 时 间 。 其 集成 度 比 EPROM 低 , 而 且 更 贵 。 

闪存 (flash memory) 

是 一 种 新 型 的 非 易 失 性 存储 器 。 不 像 RAM 那样 需要 电源 支持 才能 保存 信息 ,又 像 
RAM 一 样 具有 可 写 性 。 在 某 种 低 电 压 下 ,其 内 容 可 读 不 可 写 , 此 时 类 似 于 ROM ;在 某 种 高 
电压 下 ,信息 可 更 改 或 删除 ,这 时 又 类 似 于 RAM。 常 用 于 存储 主板 BIOS 程序 ,或 用 作 数码 
相机 存储 卡 和 优盘 ,也 可 做 成 固态 硬盘 以 代替 磁盘 存储 器 作为 辅助 存储 器 使 用 。 

双 口 RAM(dual-port RAM) 

并 行 存储 结构 中 的 一 种 。 双 口 RAM 利用 的 是 空间 并 行 技术 , 它 为 一 个 存储 体 提供 两 
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组 独立 的 读 写 控制 电路 和 两 个 读 写 端口 ,因而 可 以 对 两 个 数据 进行 并 行 的 读 写 。 

多 模块 存储 器 (multi-module memory) 

多 模块 存储 器 中 包含 多 个 存储 模块 ,每 个 存储 模块 有 其 自己 的 MAR、MDR 和 读 写 电 
路 。 根 据 不 同 的 编 址 方式 可 分 为 连续 编 址 和 交叉 编 址 。 

低位 交叉 编 址 (low-order interleaving) 

也 称 交叉 编 址 ,低位 表示 存储 器 模块 号 ,高 位 表示 存储 器 模块 内 地 址 ,使 地 址 交叉 分 散 
在 各 模块 内 。 

高 位 交叉 编 址 (high-order interleaving) 

也 称 连续 编 址 , 主 存 地 址 高 位 表示 存储 器 模块 号 ,低位 表示 存储 器 模块 内 地 址 ,使 地 址 
在 同 模块 内 连续 编 址 。 

高 速 缓存 (cache) 

在 CPU 和 主 存 之 间 的 一 个 高 速 小 容量 的 存储 器 ,在 访问 主 存 前 先 到 该 存储 器 访问 。 
如 果 将 当前 正在 访问 的 那个 存储 单元 所 在 的 主 存 块 放 到 该 存储 器 中 ,根据 程序 访问 的 局 部 
化 特性 ,这 个 主 存 块 中 的 信息 应 该 是 最 近 经 常 要 访问 的 ,所 以 不 必 再 到 主 存 去 访问 ,这 样 就 
可 以 很 快 得 到 所 要 的 信息 。 

程序 访问 的 局 部 化 

对 大 量程 序 调 查 发 现 ,程序 在 执行 过 程 中 产生 的 访 存 要 求 , 其 地 址 具有 局 部 化 特性 。 也 
就 是 说 ,在 一 个 小 的 时 间 段 内 ,存储 器 访问 的 地 址 大 多 在 一 个 局 部 空间 内 。 体 现在 时 间 和 空 
间 两 个 方面 ,可 分 为 时 间 局 部 性 和 空间 局 部 性 两 种 。 

时 间 局 部 性 (temporal locality) 

指 刚 刚 被 访问 的 单元 很 可 能 在 一 个 很 短 的 时 间 内 被 再 次 访问 。 

空间 局 部 性 (spatial locality) 

指 刚刚 被 访问 的 单元 的 邻近 单元 很 可 能 不 久 也 会 被 访问 。 

命中 率 (hit rate) 

在 快速 的 缓存 中 得 到 信息 的 概率 。 例 如 ,在 总 共 100 次 访问 中 ,能 在 cache 中 访问 到 信 
息 的 次 数 为 99 次 , 则 命中 率 为 99%。 

命中 时 间 (hit time) 

在 命中 情况 下 的 访问 时 间 。 包 括 判 断 是 否 命中 的 时 间 和 在 快速 存储 器 中 的 访问 时 间 两 
部 分 。 
缺失 率 (miss rate) 

有 些 中 文书 翻译 成 “ 失 靶 率 ? 或 “失效 率 "。 指 没有 命中 的 概率 。 例 如 ,在 总 共 100 次 访 
问 中 ,能 在 cache 中 访问 到 信息 的 次 数 为 99 次 , 则 缺失 率 为 1% 。 

缺失 损失 (miss penalty) 

在 缺失 情况 下 ,从 主 存 取 一 个 数据 块 到 cache 的 时 间 。 

主 存 块 (block) 

主 存 和 cache 之 间 进行 信息 交换 的 单位 。 把 主 存 分 成 大 小 相等 的 块 , 主 存 块 从 0 开始 
编号 。 访 问 某 个 主 存 单元 时 ,就 把 这 个 单元 所 在 的 一 个 主 存 块 调 到 cache, 根 据 程序 访问 的 
局 部 性 特点 ,在 随后 的 一 段 时 间 内 ,CPU 很 可 能 要 经 常 访问 这 个 主 存 块 ,因为 该 主 存 块 已 调 
到 cache, 所 以 就 不 需 访问 主 存 了 。 
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cache 楼 或 cache 行 (slot/line) 

cache 由 若干 行 组 成 ,每 一 行 中 有 一 个 用 于 存放 主 存 块 的 槽 ,其 大 小 与 主 存 块 一 样 ， 
cache 行 也 从 0 开始 编号 ,cache 行 号 就 是 槽 号 。 

直接 映射 cache(direct-mapped cache) 

把 主 存 的 每 一 块 映射 到 cache 的 一 个 固定 行 中 。 这 样 ,“ 主 存 块 号 "和 “cache 行 号 "存在 
模 映 射 关系 ,因此 也 称 为 模 映射 (module mapping), 即 : cache 行 ( 槽 ) 号 = 主 存 块 号 mod 
cache 行 数 。 

全 相 联 映射 cache(fully associative cache) 

每 个 主 存 块 可 装 人 到 cache 任 一 行 的 槽 中 。 每 个 cache 行 的 标志 字段 指出 了 该 行 的 数 
据 信息 取 自 主 存 的 哪个 块 。 

组 相 联 映射 cache(set-associative cache) 

结合 直接 映射 和 全 相 联 映射 的 特点 ,将 cache 所 有 行 分 组 ,把 一 个 主 存 块 映射 到 特定 
cache 组 的 任意 一 行 中 , 即 组 间 模 映射 ,组 内 全 映射 。 其 映射 关系 为 : cache 组 号 == 主 存 块 号 
mod cache 组 数 。 

多 级 cache( maultilevel cache) 

在 计算 机 系统 中 ,同时 使 用 多 个 层次 的 cache。 例 如 ,在 CPU 和 主 存 之 间 设 置 两 级 
cache: Ll cache 和 L2 cache。 一 般 L1 cache 是 数据 cache 和 代码 cache 分 离 的 。 

数据 cache(data cache) 

专门 用 来 存放 数据 信息 的 高 速 缓存 。 

代码 cache(code cache) 

专门 用 来 存放 指令 代码 的 高 速 缓存 。 也 称 指令 cache。 

分 离 式 cache(split cache) 

指数 据 和 指令 分 开 存 放 在 各 自 的 数据 cache 和 指令 cache 中 。 

先进 先 出 (First-In-First-Out,FIFO) 

是 一 种 替换 算法 ,其 基本 思想 是 ,总 是 把 最 先 调和 人 cache 的 一 个 主 存 块 替换 出 去 。 

最 近 最 少 用 (Least Recently Used,LRU) 

是 一 种 替换 算法 ,其 基本 思想 是 ,总 是 把 最 近 最 少 用 的 一 个 主 存 块 从 cache 中 替换 
出 去 。 

直 写 (write through) 

每 次 写 cache 的 同时 也 写 主 存 , 主 存 与 cache 始终 保持 一 致 性 。 这 种 方式 比较 简单 ,能 
保持 主 存 与 cache 副本 的 一 致 性 ,但 要 插入 慢 速 的 访 存 操作 ,而 且 有 些 写 入 过 程 有 可 能 是 不 
必要 的 ,例如 中 间 结 果 的 写 和 操作。 这 种 方式 的 中 文 说 法 较 多 ,有 全 写 、 直 写 、 写 直达 ,通过 

写 缓冲 (write buffer) 

在 使 用 直 写 方式 处 理 写 操作 时 ,为 了 减少 每 次 写 主 存 的 时 间 ,在 cache 和 主 存 之 间 加 一 
个 写 缓冲 。 这 样 ,不 必 每 次 都 写 主 存 ,而 只 要 写 到 一 个 快速 的 写 缓冲 就 行 了 。 当 发 生 一 次 写 
操作 时 ,CPU 同时 写 cache 和 写 缓冲 ,然后 由 存储 控制 器 将 写 缓冲 内 容 写 到 主 存 。 

回 写 (write back) 

每 次 写 操作 时 , 先 暂 时 只 写 cache, 并 用 标志 (dirty bit) 予 以 注 明 ,直到 该 块 内 容 需 从 
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cache 中 替换 出 去 时 , 才 一 次 写 人 主 存 。 这 种 方式 不 在 写 cache 中 插入 慢 速 的 写 主 存 操作 ， 
可 以 保持 程序 运行 的 快速 性 。 但 在 写 回 主 存 前 , 主 存 与 cache 内 容 不 一 致 ,引起 主 存 内 容 失 
效 。 这 种 方式 的 中 文 说 法 较 多 ,有 写 回 . 回 写 .一 次 性 写 等 。 

3C 模型 (three Cs model) 

存储 器 层次 结构 中 信息 访问 时 的 缺失 类 型 以 及 结构 的 改变 对 这 些 缺 失 类 型 的 影响 ,可 
以 用 一 个 模型 来 进行 分 析 。 该 模型 给 出 的 三 个 缺失 类 型 一 一 强制 缺失 (compulsory miss) 、 
容量 缺失 (capacity miss) ,冲突 缺失 (conflict miss) 名 称 的 首 字母 正好 都 是 C, 所 以 称 为 3C 
模型 。 

强制 缺失 (compulsory miss) 

调和 人 cache 前 第 一 次 被 用 到 时 ,一 定 会 发 生 缺 失 。 此 时 的 缺失 也 被 称 为 冷 启动 缺失 
(cold-start miss) 。 

容量 缺失 (capacity miss) 

由 于 cache 容量 的 限制 ,使 得 有 些 主 存 块 无 法 继续 保存 在 cache 中 而 造成 缺失 。 其 直接 
原因 就 是 刚 被 替换 出 去 的 块 很 快 又 需要 取 回 来 。 

冲突 缺失 (conflict miss) 

这 种 缺失 现象 发 生 在 组 相 联 或 直接 映射 cache 中 多 个 块 同时 竞争 同一 个 位 置 时 。 冲 突 
缺失 率 与 关联 度 有 关 。 

关联 度 (associativity) 

指 一 个 主 存 块 映射 到 cache 中 时 可 能 存放 的 位 置 个 数 。 显 然 ,直接 映射 的 关联 度 为 1; 
全 相 联 映射 的 关联 度 最 高 ,为 cache 总 行 数 ;N 路 组 相 联 的 关联 度 居中 ,为 N。 

虚拟 存储 器 (virtual memory) 

虚拟 存储 器 是 一 种 存储 管理 机 制 ,在 采用 虚拟 存储 器 的 系统 中 ,每 个 作业 运行 时 ,可 以 
只 装 入 当前 执行 到 的 一 部 分 到 内 存 ,而 让 暂时 执行 不 到 的 另 一 部 分 放 在 磁盘 上 , 当 需 要 用 到 
时 再 从 磁盘 装 和 人 到 主 存 , 这 样 使 得 在 很 小 的 主 存 空间 能 运行 一 个 比 它 大 的 作业 ,而且 用 户 编 
写 程序 时 用 到 的 好 辑 地 址 空间 可 以 比 主 存 地 址 空间 大 。 对 用 户 来 说 ,好 像 计算 机 系统 具有 
一 个 容量 很 大 的 主 存储 器 , 称 为 虚拟 存储 器 。 

物理 存储 器 (physical memory) 

通常 把 主 存储 器 称 为 物理 存储 器 。 

虚拟 地 址 (virtual address) 

通常 把 用 户 编写 程序 时 所 用 的 地 址 称 为 虚拟 地 址 ,或 称 为 逻辑 地 址 。 每 个 程序 都 在 同 
一 个 虚拟 地 址 空间 中 编写 程序 。 虚 拟 地 址 的 位 数 确定 了 虚拟 地 址 空间 的 大 小 。 例 如 ,如 果 
虚拟 地 址 为 32 位 , 按 字 节 编 址 , 则 虚拟 地 址 空间 大 小 为 2*B==4GB。 

虚 页 号 (Virtual Page Number,VPN) 

为 了 实现 虚拟 存储 器 ,通常 把 虚拟 地 址 空间 划分 为 若干 等 长 的 块 ,每 块 称 为 一 页 
(page) 。 操 作 系统 在 加 载 程序 时 , 按 页 为 单位 进行 内 存 分 配 。 每 页 按 顺 序 进行 编号 ,从 第 0 
页 开始 。 虚 拟 地 址 空间 所 包含 的 页 数 决定 了 虚 页 号 的 位 数 ,虚拟 地 址 的 高 位 部 分 为 虚 页 号 。 

页 内 偏 移 量 (page offset) 

指 需 访 问 的 逻辑 地 址 位 于 当前 页 的 哪个 位 置 。 页 面 大 小 决定 了 页 内 偏 移 量 的 位 数 。 例 
如 ,如 果 一 个 虚拟 页 的 大 小 为 2KB(2aB) , 按 字 节 编 址 ,那么 ,页 内 偏 移 量 就 是 11 位。 页 内 
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偏 移 量 为 虚拟 地 址 的 低位 部 分 。 

物理 地 址 (physical address) 

主 存储 器 地 址 称 为 物理 地 址 ,也 称 主 存 地 址 或 实地 址 。 

页 框 (page frame) 

有 些 书 把 页 框 ( 有 时 也 翻译 为 页 帧 ) 称 为 物理 页 或 实 页 。 操 作 系统 在 管理 内 存 时 , 按 页 
为 单位 进行 内 存 分 配 。 其 具体 做 法 就 是 ,把 主 存储 器 分 成 固定 长 且 比 较 小 的 存储 块 , 称 为 页 
框 ,每 个 进程 也 被 划分 成 等 长 的 程序 块 。 这 样 ,对 进程 进行 存储 分 配 时 ,将 一 个 程序 块 ( 即 虚 
拟 页 ) 装 到 一 个 可 用 的 存储 块 (页 框 ) 中 。 

物理 页 号 (physical Page Number, PPN) 

把 主 存 空 间 分 成 固定 长 的 页 框 ,从 0 开始 按 顺 序 编号 ,该 编号 就 是 物理 页 号 ,也 称 为 页 
框 号 或 实 页 号 。 物 理 地 址 的 高 位 部 分 是 物理 页 号 。 

地 址 变换 (address translation) 

把 程序 中 的 虚拟 地 址 转换 为 物理 地 址 的 过 程 称 为 地 址 变换 。 也 叫 存 储 器 映射 (memory 
mapping) 。 

重 定位 (relocation) 

在 采用 虚拟 存储 器 的 系统 中 ,程序 员 都 在 一 个 同样 的 虚拟 地 址 空间 中 写 程 序 。 在 程序 
装 人 系统 运行 时 ,操作 系统 按照 某 种 存储 管理 机 制 (分 段 、 分 页 、 段 页 ) 把 用 户 程序 的 一 部 分 
或 全 部 放 到 内 存 中 ,并 把 存放 的 物理 地 址 信息 记录 到 段 表 或 页 表 中 ,以 建立 虚拟 地 址 空间 和 
物理 地 址 空间 的 上 映射。 实现 这 种 映射 的 过 程 称 为 程序 重 定位 , 它 建立 了 逻辑 地 址 和 物理 地 
址 的 映射 关系 ,实现 了 逮 辑 地 址 向 物理 地 址 的 转换 。 所 以 , 重 定位 和 地 址 转换 是 同一 个 

有 两 种 重 定位 方式 : 一 种 方式 通过 链接 程序 或 加 载 程序 进行 地 址 转换 而 实现 程序 重 定 
位 ,这 种 方式 下 ,程序 执行 时 每 条 指令 中 的 地 址 已 经 是 物理 地 址 , 称 为 静态 重 定位 ; 另 一 种 方 
式 是 在 程序 执行 过 程 中 由 硬件 实现 地 址 转换 , 称 为 动态 重 定位 。 

页 表 (page table) 

每 个 进程 有 一 个 页 表 , 记 录 该 进程 的 每 个 页 存放 在 主 存 的 哪个 页 框 中 ,或 在 辅 存 哪个 地 
方 。 页 表 中 一 般 有 装 入 位 ,修改 位 ,替换 控制 位 ,访问 控制 位 \、 实 页 号 等 。 

页 表 基 址 寄存 器 (page table base register) 

每 个 进程 有 一 个 页 表 , 页 表 在 主 存 中 的 首 地 址 被 记录 在 一 个 特殊 的 寄存 器 中 ,这 个 特殊 
寄存 器 被 称 为 页 表 基 址 寄存 器 ,简称 页 表 寄 存 器 。 

有 效 位 (valid bit) 

用 来 表示 对 应 页 是 否 装 人 主 存 并 有 效 , 也 称 为 装 和 人 位 。 若 该 位 为 "1” ,表示 该 页 在 主 存 
中 并 且 没有 被 淘汰 。 若 该 位 为 "0”, 则 说 明 该 页 不 在 主 存 , 发 生 了 * 缺 页 ?异常 。 

修改 位 (modify bit) 

用 来 表示 对 应 页 在 主 存 期 间 是 否 被 修改 过 。 若 该 位 为 "1”, 则 表明 该 页 已 被 修改 过 , 淘 
汰 时 必须 将 该 页 写 回 到 磁盘 。 若 该 位 为 “0”, 则 表明 该 页 未 被 修改 过 ,淘汰 时 不 需要 将 该 页 
写 回 到 磁盘 。 有 些 作者 或 系统 把 它 称 为 “ 脏 位 Dirty bit”。 

使 用 位 (reference bit/Use bit) 

用 来 表示 对 应 页 的 使 用 情况 , 据 此 可 以 了 解 该 页 是 最 近 经 常 被 访问 还 是 很 少 被 访问 , 因 
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而 决定 是 否 马上 被 蔡 换 。 所 以 ,也 称 为 蔡 换 控 制 位 。 

访问 方式 位 (access bit) 

用 来 表示 该 页 的 读 写 权限 。 例 如 ,代码 段 所 在 页 的 访问 方式 一 般 是 “执行 /只 读 ”; 共 享 
数据 段 所 在 页 一 般 是 “只 读 ”; 私 有 数据 段 所 在 页 一 般 是 “可 读 可 写 ”。 也 称 为 访问 控制 位 或 
存 取 权 限 位 。 

缺 页 (page fault) 

需要 访问 的 页 不 在 内 存 中 时 , 则 发 生 “ 缺 页 ”异常 。 通 过 检查 “有 效 位 ”就 可 以 判断 是 否 
“ 缺 页 ”。 

交换 (swapping)/ 页 面 调度 (paging) 

缺 页 时 ,需要 把 所 缺 页 面 从 磁盘 调 到 主 存 中 ,这 个 过 程 称 为 “页 面 换 和 信 ”( 或 磁盘 调和 人 )， 
当 需 要 从 主 存 淘 汰 一 页 到 磁盘 时 , 称 为 “页 面 换 出 (或 调 出 磁盘 ) 。 页 面 换 入 / 换 出 称 为 交换 
(swapping) 或 页 面 调度 (paging) 。 

按 需 调 度 页 面 (demand paging) 

只 有 发 生 “ 缺 页 ”时 才 换 入 页 面 。 大 部 分 现代 计算 机 系统 都 使 用 这 种 策略 进行 存储 
管理 。 

LRU 页 (Least Recently Used page) 

指 最 近 最 少 使 用 的 页 。 通 过 检查 “使 用 位 ”可 以 找到 LRU 页 。 

快 表 (Translation Lookaside Buffer,TLB) 

用 一 个 特殊 的 cache 来 跟踪 记录 最 近 用 过 的 页 表 表 项 。 因 为 页 表 表 项 主要 用 于 地 址 转 
换 , 所 以 把 这 种 特殊 的 cache 称 为 转换 后 援 缓冲 器 (Translation-Lookaside Buffer, TLB)。 
因为 在 TLB 中 查找 页 表 项 速度 很 快 ,所 以 TLB 也 被 称 为 快 表 。TLB 通常 很 小 ,在 高 端 机 
器 中 也 通常 不 超过 128 一 256 项 ,一 般 用 全 相 联 方式 ,中 等 性 能 机 器 多 用 小 的 组 相 联 方式 。 

分 页 式 虚拟 存储 器 (paging VM) 

分 页 式 虚拟 存储 器 的 主要 思想 是 ,把 主 存 储 器 分 成 国定 长 且 比较 小 的 存储 块 ( 称 为 页 
框 ) ,虚拟 地 址 空间 也 被 划分 成 等 长 的 程序 块 ( 称 为 页 ) 。 操 作 系统 把 当前 用 到 的 页 装 和 人 到 空 
闲 的 主 存 存储 块 中 。 所 以 分 页 方式 是 按 固定 长 的 页 进行 分 配 和 调度 的 。 收 辑 地 址 由 页 号 和 
页 内 偏 移 量 组 成 。 

分 段 式 虚拟 存储 器 (segmentation VM) 

分 段 式 虚拟 存储 器 与 分 页 式 不 同 。 分 页 式 使 用 固定 大 小 的 块 进行 管理 ,而 分 段 方式 采 
用 变 长 块 的 机 制 管理 存储 器 .“ 段 ”是 按照 程序 的 逻辑 结构 划分 而 成 的 多 个 相对 独立 的 部 
分 ,例如 过 程 . 子 程序 ,数据 表 、 阵 列 等 。 操 作 系统 在 进行 虚拟 空间 和 主 存 空 间 对 应 时 , 按 程 
序 中 实际 的 段 来 分 配 主 存 空间 ,每 个 段 在 主 存 中 的 起 始 位 置 记录 在 段 表 中 ,并 附 以 * 段 长 ” 
项 。 段 表 本 身 也 是 主 存 中 的 一 个 可 再 定位 段 。 一 个 大 程序 由 多 个 代码 段 和 多 个 数据 段 构 
成 。 介 辑 地 址 由 段 号 和 段 内 地 址 组 成 。 

段 页 式 虚拟 存储 器 (paged segmentation VM) 

分 段 和 分 页 相 结合 的 方式 。 程 序 按 独 立 模块 分 段 , 段 内 再 分 成 固定 大 小 的 页 , 主 存 分 配 
时 仍 以 页 为 基本 单位 。 用 段 表 和 页 表 ( 每 段 一 个 ) 进 行 两 级 定位 管理 。 逻 辑 地 址 由 段 地 址 、 
页 地 址 和 偏 移 量 三 个 字段 构成 。 根 据 段 地 址 到 段 表 中 查阅 与 该 段 相 应 的 页 表 指 针 , 转 向 页 
表 , 然 后 根据 页 地 址 从 页 表 中 查 到 该 页 在 主 存 中 的 实 页 号 ,与 偏 移 量 相 加 得 到 物理 地 址 。 
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进程 (process) 

是 程序 在 系统 中 的 某 个 数据 集合 上 的 一 次 动态 运行 。 当 运行 一 个 程序 时 ,就 启动 了 一 
个 进程 ,同一 个 程序 在 不 同 的 数据 集 上 运行 构成 不 同 的 进程 。 进 程 是 操作 系统 进行 资源 分 
配 的 单位 。 当 某 一 个 进程 占用 CPU 执行 时 ,该 进程 是 活动 进程 (active process) ,否则 是 非 
活动 进程 (inactive process) 。 

管理 模式 (supervisor mode) 

也 称 为 系统 模式 、 内 核 模式 、 超 级 用 户 模式 , 管 态 、 内 核 态 、 核 心态。 在 管理 模式 下 ,处 理 
器 运行 内 核 代码 ,允许 使 用 特权 指令 ,例如 停机 指令 、 开 /关中 断 指令 cache 冲刷 指令 等 。 

用 户 模式 (user mode) 

也 称 目 态 、 用 户 态 。 在 用 户 模式 下 ,处理 器 运行 用 户 进程 ,此 时 不 允许 使 用 特权 指令 。 

系统 调用 (system call) 

用 来 使 CPU 从 用 户 态 转换 到 内 核 态 。 系 统 调用 是 一 条 专门 的 特殊 指令 ,执行 这 种 指 
令 后 ,CPU 就 调 出 特定 的 操作 系统 内 核 模块 进行 执行 ,进入 内 核 态 。 在 内 核 态 下 ,操作 系统 
可 以 执行 专门 的 管 态 指 令 ( 或 称 特权 指令 ,用 户 程 序 不 能 使 用 这 些 指令 ) 来 对 一 些 用 户 进 程 
不 能 访问 的 CPU 状态 进行 读 写 。 

异常 返回 (return from exception) 

异常 返回 指令 用 于 从 操作 系统 内 核 进 程 返回 到 用 户 进程 。 通 过 系统 调用 进入 操作 系统 
内 核 时 , 需 保留 系统 调用 指令 后 面 一 条 指令 的 地 址 作为 返回 地 址 ,所 以 用 异常 返回 指令 返回 
用 户 进 程 时 ,可 以 根据 该 地 址 进行 返回 。 

存储 保护 (protection) 

虚拟 存储 器 可 以 实现 多 道 程序 运行 ,也 就 是 说 ,在 一 个 主 存 物 理 空间 中 同时 有 多 个 进程 
共存 。 为 避免 主 存 中 多 道 程 序 相互 干扰 ,防止 某 进程 出 错 而 破坏 其 他 进程 的 正确 性 ,或 某 进 
程 不 合法 地 访问 其 他 进程 的 存储 区 ,应 对 每 个 进程 进行 存储 保护 。 存 储 保护 包含 两 个 方面 : 
地 址 越界 , 即 访问 了 不 该 访问 的 区 域 ; @ 访 问 越权 , 即 进 行 了 不 该 进行 的 存 取 操作 。 


7.4 常见 问题 解答 


1. ROM 和 RAM 一 样 , 都 是 随机 存 取 存 储 器 吗 ? 

答 : 是 的 。 虽 然 经 常 把 只 读 存 储 器 (ROM) 和 随机 访问 存储 器 (RAM) 放 在 一 起 进行 分 
类 ,但 ROM 的 存 取 方式 和 RAM 是 一 样 的 ,都 是 通过 对 地 址 进行 译 码 , 选 择 某 个 单元 进行 
读 写 。 所 以 两 者 采用 的 都 是 随机 存 取 方式 。 不 过 ,在 程序 执行 过 程 中 ,ROM 存储 区 只 能 读 
出 信息 ,不 能 修改 ,而 RAM 区 可 以 读 出 ,也 可 以 修改 信息 。 

2. 寄存 器 和 主 存储 器 都 是 用 来 存放 信息 的 ,它们 有 什么 不 同 ? 

答 : 寄存 器 在 CPU 中 ,用 触发 器 来 实现 ,速度 极 快 ,价格 高 ,容量 只 有 几 十 个 ,多 的 机 器 
也 只 有 几 百 个 ,主要 用 来 暂 存 指令 运行 时 的 操作 数 和 结果 。 

主 存储 器 在 CPU 之 外 ,用 MOS 管 电路 实现 ,速度 没有 寄存 器 快 ,价格 也 比 寄存 器 便 
宜 , 容 量 可 以 达到 GB 数量 级 ,用 来 存放 被 启动 程序 的 代码 和 数据 。 

3. 存 取 时间 T 就 是 存储 周期 Tw 吗 ? 

答 : 不 是 。 存 取 时 间 TA 是 执行 一 次 读 操作 或 写 操作 的 时 间 。 分 为 读 出 时 间 和 写 人 时 
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间 。 读 出 时 间 为 从 主 存 接收 到 有 效 地 址 开始 到 数据 取出 有 效 为 止 的 最 短 时 间 ; 写 人 时 间 是 
从 主 存 接收 到 有 效 地 址 开始 到 数据 写 人 被 写 单元 为 止 的 最 短 时 间 。 存 储 周 期 Ty 是 指 存储 
器 进行 连续 两 次 独立 的 读 或 写 操作 所 需 的 最 小 时 间 间 隔 。 所 以 存 取 时 间 TA 不 等 于 存储 周 
期 Tv。 通常 存储 周期 Tw 大 于 存 取 时 间 TA 。 

4. 刷新 和 再 生 是 一 回 事 吗 ? 

答 : 不 是 一 回 事 。 对 某 个 单元 的 刷新 和 再 生 的 操作 过 程 是 一 样 的 , 即 读 后 恢复 。 但 再 
生 操 作 是 随机 的 ,只 对 所 读 单元 进行 ;而 刷新 操作 则 是 按 顺 序 定 时 按 行进 行 的 。 

5. 刷新 是 一 个 个 芯片 按 顺序 完成 的 吗 ? 

答 : 不 是 。 刷 新 按 行进 行 ,所 有 存储 阵列 的 同一 行 中 的 记忆 单元 同时 被 刷新 ,因此 仅 需 
要 行 地 址 ,不 需要 列 地 址 。 刷 新 行 号 由 DRAM 芯片 的 刷新 控制 电路 中 的 刷新 计数 器 产生 。 
整个 存储 器 中 的 所 有 芯片 的 相同 行 同 时 进行 刷新 ,例如 , 若 有 8 个 1024X 1024X4 的 
DRAM 芯片 构成 一 个 存储 器 , 则 只 需要 1024 次 刷新 操作 就 可 以 把 整个 存储 器 刷新 一 遍 。 

6. 主 存 都 是 由 RAM 组 成 的 吗 ? 

答 : 不 是 。 主 存 是 由 RAM 和 ROM 两 部 分 组 成 的 ,它们 统一 编 址 ,分 别 占 用 不 同 的 地 
址 空间 。 

7. 目前 流行 的 内 存 条 技术 是 什么 ? 

答 ; 目前 主 存 常用 的 是 基于 SDRAM(Synchronous DRAM) 芯 片 技术 的 内 存 条 ,包括 
DDR SDRAM、DDR2 SDRAM、DDR3 SDRAM 和 DDR4 SDRAM 等 。SDRAM 是 一 种 与 
当年 Intel 公司 推出 的 芯片 组 中 北桥 芯片 的 前 端 总 线 同 步 运行 的 DRAM 芯片 ,因此 称 为 同 
步 DRAM。 

8. SDRAM 芯片 中 的 操作 由 什么 信号 进行 同步 ? 

答 : SDRAM 芯片 的 每 一 步 操作 都 在 外 部 系统 时 钟 CLK 的 控制 下 进行 ,也 即 芯片 内 部 
工作 频率 与 外 部 系统 时 钟 频 率 同 步 。 

9. 连接 SDRAM 芯片 的 存储 器 总 线 是 否 支持 突 发 传输 方式 ? 

答 : 支持 突 发 (burst) 传 输 方式 。 只 要 在 第 一 次 存 取 时 给 出 首 地 址 ,以 后 按 地 址 顺序 读 
写 即 可 ,不 再 需要 地 址 建立 时 间 和 行 、 列 预 充电 时 间 ,就 能 连续 快速 地 从 行 缓冲 器 中 输出 一 
连 串 数据 。 

10. SDRAM 芯片 技术 中 的 DDR、DDR2、DDR3 等 各 是 什么 含义 ? 

答 : DDR 是 Double Data Rate 的 缩写 ,含义 是 双 倍数 据 传输 率 。 通 过 芯片 内 部 IO 组 
冲 中 数据 的 两 位 预 取 功能 ,并 利用 存储 器 总 线 上 时 钟 信号 CLK 的 上 升 沿 与 下 降 沿 进行 两 次 
传送 ,使 总 线 上 每 秒 传送 数据 的 次 数 达 到 芯片 内 部 工作 频率 的 两 倍 ,也 是 存储 器 总 线 时 钟 频 
率 的 两 倍 。 

DDR2 采用 4 位 预 取 方式 ,外 部 总 线 时 钟 频 率 是 芯片 内 部 工作 频率 的 两 倍 ,因而 ,总 线 
上 每 秒 传送 数据 的 次 数 达 到 芯片 内 部 工作 频率 的 4 倍 。 存 储 器 总 线 上 时 钟 信号 CLK 的 上 
升 沿 与 下 降 沿 进行 两 次 传送 ,因而 总 线 上 每 秒 传送 数据 的 次 数 是 总 线 时 钟 频 率 的 两 倍 。 

DDR3 采用 8 位 预 取 方式 ,外 部 总 线 时 钟 频率 是 芯片 内 部 工作 频率 的 4 倍 ,因而 ,总 线 
上 每 秒 传送 数据 的 次 数 达 到 芯片 内 部 工作 频率 的 8 倍 。 存 储 器 总 线 上 时 钟 信号 CLK 的 上 
升 沿 与 下 降 沿 进行 两 次 传送 ,因而 总 线 上 每 秒 传送 数据 的 次 数 是 总 线 时 钟 频率 的 两 倍 。 
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11. 高 速 缓存 (cache) 对 程序 员 来 说 是 透明 的 吗 ? 

答 : cache 的 访问 过 程 对 程序 员 来 说 是 透明 的 。 执 行 一 条 指令 时 ,CPU 需要 到 内 存 取 
指令 ,有 些 指令 还 要 访问 内 存 来 取 操 作 数 或 将 运算 结果 保存 到 内 存 。 采 用 cache gai 
系统 中 ,总 是 先 到 cache 去 访问 指令 或 数据 , 当 cache 缺失 时 才 到 主 存 去 访问 。 这 个 过 程 是 
CPU 在 执行 指令 过 程 中 自动 完成 的 。 psi ep eh cache 
中 ,在 cache 的 哪 一 行 中 ,也 不 需要 知道 cache 的 访问 过 程 , 只 要 在 指令 中 给 定 存储 单元 地 址 
( 即 变量 的 指针 或 指令 的 标号 ) 就 行 了 。 事 实 上 ,现代 计算 机 都 采用 虚拟 存储 器 机 制 ,所 以 ， 
在 程序 员 编 写 的 程序 或 编译 生成 的 程序 中 ,指令 给 出 的 地 址 还 不 是 真正 的 内 存单 元 地 址 ,而 
是 一 个 虚拟 地 址 (逻辑 地 址 ) ,操作 系统 需要 对 程序 进行 重 定位 ,以 页 或 段 为 单位 把 程序 装载 
到 内 存 中 ,并 由 CPU 把 逻辑 地 址 转换 为 真正 的 内 存 地 址 (物理 地 址 ) 。 

12. 主 存 和 cache 之 间 按 主 存 块 为 单位 传送 数据 时 ,是 否 主 存 块 越 大 越 好 ? 

答 : 不 是 。 主 存 块 大 可 充分 利用 程序 访问 的 空间 局 部 性 特点 ,使 得 一 个 比较 大 的 局 部 
空间 被 一 起 调 到 cache 中 ,因而 可 以 增加 命中 机 会 。 但 是 , 主 存 块 不 能 太 大 ,主要 原因 有 两 
个 ; @ 主 存 块 变 大 ,使 得 缺失 损失 也 变 大 ,因为 需要 花费 更 多 时 间 从 主 存 读 一 个 较 大 的 块 ; 
@ 主 存 块 变 大 , 则 cache 行 数 变 少 ,因而 需要 替换 的 可 能 性 增加 ,从 而 导致 命中 的 可 能 性 
变 小 。 

13. 指令 和 数据 都 是 放 在 同一 个 cache 中 的 吗 ? 

答 : 现代 计算 机 系统 中 ,一 i cache 系统 。CPU 执行 指令 时 , 先 到 速度 最 快 的 
一 级 cache(L1 cache) 中 寻找 指令 或 数据 , 找 不 到 时 ,再 到 速度 次 快 的 二 级 cache(L2 cache) 
中 找 …… 最 后 到 主 存 中 找 。 对 于 一 级 cache, 指 令 和 数据 一 般 分 开 存放 ,分 别称 为 Ll Data 
Cache 和 L1 Code Cache; 而 对 于 二 级 以 上 的 cache, 其 指令 和 数据 是 放 在 一 起 的 。 

14. cache 可 以 做 在 CPU 芯片 里 面 吗 ? 

答 : 可 以 。 早 期 的 计算 机 ,其 cache 是 做 在 CPU 芯片 外 的 。 但 随 着 CPU 芯片 技术 的 
提高 ,cache 可 以 做 在 CPU 芯片 里 面 。 从 逻辑 上 来 说 ,cache 是 位 于 CPU 和 主 存 之 间 的 部 
件 ,但 在 物理 上 ,cache 被 封装 在 CPU 芯片 内 。 目 前 ,一 级 cache、 二 级 cache 甚至 三 级 cache 
都 可 以 封装 在 CPU 芯片 中 。 

15. 直接 映射 方式 下 是 否 需要 考虑 替换 方式 ? 为 什么 ? 

答 : 无 须 考虑 。 因 为 在 直接 映射 方式 下 ,一 个 给 定 的 主 存 块 只 能 映射 到 一 个 固定 的 
cache 槽 中 ,所 以 ,在 对 应 cache 槽 已 有 一 个 主 存 块 的 情况 下 ,新 的 主 存 块 毫 无 选择 地 把 原先 
已 有 的 那个 主 存 块 替换 掉 , 因 而 无 须 考虑 替换 算法 。 

16. 在 CPU 和 主 存 间 加 入 了 多 个 cache, 计 算 机 总 存储 量 就 增加 了 ,对 吗 ? 

答 : 不 对 。 虽 然 cache 是 存储 器 ,具有 几 百 KB 甚至 几 MB 的 容量 ,但 因为 它 存放 的 是 
主 存 信息 的 副本 ,所 以 ,并 不 能 增加 系统 的 存储 容量 

17. 怎样 保证 CPU 要 找 的 指令 和 数据 大 都 能 在 cache 中 访问 到 呢 ? 

答 : 根据 程序 访问 的 局 部 性 特点 可 知 ,不 管 是 访问 指令 还 是 数据 ,CPU 在 执行 程序 的 
过 程 中 , 若 某 个 地 址 在 T 时 刻 被 访问 , 则 该 地 址 及 其 邻近 地 址 在 了 十 A 时 间 段 内 很 可 能 也 
被 访问 。 因 而 ,在 访问 到 某 个 内 存 地 址 时 ,把 该 地 址 及 其 邻近 的 内 存单 元 内 容 ( 就 是 一 个 
存 块 ,block) 一 起 复制 到 cache 中 。 这 样 ,在 接 下 来 的 一 段 时 间 内 ,CPU 所 要 访问 的 指令 或 
数据 就 基本 上 能 在 cache 中 找到 了 。 
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18. CPU 要 找 的 指令 和 数据 都 能 在 cache 中 访问 到 吗 ? 为 什么 ? 

答 : 不 能 。 指 令 /数据 在 第 一 次 被 访问 时 ,肯定 不 在 cache 中 ,因而 在 cache 中 访问 不 
到 。 此 时 ,就 会 把 所 访问 的 指令 /数据 所 在 的 主 存 块 从 主 存 取 到 cache 中 ,这 样 只 要 这 个 主 
存 块 不 被 其 他 主 存 块 蔡 换 出 来 ,以 后 再 访问 这 个 数据 /指令 或 者 同一 块 中 其 他 数据 /指令 时 ， 
就 能 在 cache 中 命中 了 。 但 是 , 随 着 程序 的 执行 ,CPU 所 访问 的 地 址 区 域 会 移 到 另外 的 主 
存 块 ,由 于 cache 容量 的 限制 , 当 新 的 主 存 块 调 人 cache 时 ,原来 在 cache 中 的 主 存 块 很 可 能 
被 新 的 主 存 块 蔡 换 出 来 。 如 果 替 换 出 来 后 ,CPU 又 要 对 其 进行 访问 ,那么 ,CPU 在 cache 中 
肯定 找 不 到 。 所 以 ,CPU 要 找 的 指令 和 数据 不 可 能 总 在 cache 中 访问 到 。 

19. 发 生 取 指令 缺失 时 的 处 理 过 程 是 什么 ?这 是 由 硬件 还 是 软件 完成 的 ? 

答 : 每 条 指令 执行 的 第 一 步 是 取 指令 。 若 在 cache 中 取 当 前 指令 时 发 生 缺 失 , 则 处 理 
器 必须 按 如 下 步骤 完成 : 四 把 程序 计数 器 的 值 恢 复 到 当前 指令 的 地 址 ,然后 通过 总 线 中 的 
地 址 线 送 到 存储 器 中 的 地 址 缓冲 器 中 ,以 便 存 储 器 对 地 址 译 码 。@) 控 制 存储 器 执行 一 次 读 
操作 ( 若 一 个 主 存 块 只 有 一 条 指令 , 则 一 次 读 操作 读 一 条 指令 即 可 ; 若 一 个 主 存 块 占用 多 条 
指令 , 则 控制 一 次 读 出 多 条 指令 或 读 若干 次 ) ,对 主 存 的 访问 要 通过 总 线 完 成 ,一 次 总 线 事务 
完成 一 次 读 操作 。@ 读 出 的 指令 写 到 cache 中 ,并 把 主 存 地 址 的 高 位 写 入 到 标记 字段 ,最 后 
设置 有 效 位 。@ 重 新 执行 当前 指令 的 第 一 步 操作 , 即 取 指 令 , 这 次 在 cache 中 取 指令 时 便 能 
命中 。 

显然 ,cache 缺失 不 是 内 部 异常 ,更 不 是 外 部 中 断 ,不 会 引起 对 当前 正在 执行 程序 的 “中 
断 ”, 因 而 不 会 调 出 操作 系统 内 核 程序 来 处 理 cache 缺失 , 即 上 述 处 理 过 程 不 是 由 软件 完成 
的 ,而 是 由 CPU 这 个 硬件 完成 的 。 

20. 引入 cache 后 ,CPU 的 数据 通路 和 控制 部 件 要 增加 哪些 功能 和 相关 的 电路 ? 

答 : 在 指令 执行 过 程 中 ,CPU 必须 从 存储 器 取 指令 ,有 些 指令 还 要 从 存储 器 取 操 作 数 ， 
或 把 结果 写 到 存储 器 中 。CPU 总 是 先 到 L1 cache 中 寻找 , 找 不 到 再 从 L2 以 上 的 cache 或 
主 存 中 找 。 所 以 ,在 指令 执行 过 程 中 ,控制 部 件 必须 能 够 检测 访问 有 没有 命中 。 实 现 这 个 功 
能 只 要 用 若干 比较 器 和 一 些 门 电路 即 可 。 若 命中 , 则 直接 在 cache 中 访问 即 可 。 若 缺失 , 则 
处 理 器 需要 进行 一 系列 的 处 理 。 包 括 : 使 当前 指令 暂时 停止 执行 ,并 冻结 所 有 寄存 器 ,然后 
用 一 个 专门 的 控制 器 控制 从 L2 以 上 的 cache 或 主 存 中 取出 当前 访问 地 址 所 在 的 一 个 主 存 
块 送 到 cache 中 ,并 设置 有 效 位 和 标志 (tag) 信 息 ,最 后 重新 从 暂停 执行 的 时 钟 周期 开始 执 
行 指令 。 

21. 写 操作 处 理 和 读 操作 处 理 有 什么 不 同 ? 

答 : 因为 读 操作 不 改变 cache 中 数据 的 值 ,所 以 , 读 操作 时 的 缺失 处 理 比 较 简 单 。 只 要 
把 主 存 块 从 内 存 装 人 到 cache 中 即 可 。 而 写 操作 时 会 改变 cache 中 数据 的 值 ,造成 cache 数 
据 和 主 存 数据 的 不 一 致 。 因 此 ,要 有 相应 的 写 策略 来 解决 这 种 不 一 致 性 。 

22. cache 访问 缺失 对 指令 的 执行 有 影响 吗 ? 有 怎样 的 影响 ? 

答 : cache 访问 缺失 对 指令 的 执行 有 很 大 影响 ,会 大 大 延长 指令 的 执行 时 间 。 延 长 多 少 
由 缺失 损失 确定 , 若 从 L2 cache 取 的 话 , 一 般 需 要 5~10 个 时 钟 周期 ; 若 从 主 存 取 的 话 , 需 
要 25~100 个 周期 。 执 行 一 条 指令 时 的 缺失 情况 有 以 下 几 种 可 能 : @ 取 指令 时 缺失 。 此 
时 ,从 L2 以 上 cache 或 内 存 取出 指令 或 者 取出 指令 所 在 主 存 块 ,并 存 人 L1 code cache, 然 
后 ,再 开始 重新 执行 指令 。@@ 读 数据 时 缺失 。 此 时 ,从 L2 以 上 cache 或 内 存 取出 数据 或 者 
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数据 所 在 主 存 块 ,并 存 人 L1 data cache, 然 后 ,从 取 数 那个 时 钟 周 期 开始 执行 指令 。@ 写 数 
据 时 缺失 。 此 时 ,需要 根据 相应 的 写 策略 来 决定 是 当时 就 更 新 主 存 的 数据 (write through) 
还 是 在 主 存 块 被 替换 时 更 新 主 存 的 数据 (write back)。 存 数 操作 结束 后 ,指令 也 就 执行 结 
束 下 。 

如 果 一 条 指令 执行 过 程 中 既 发 生 取 指令 缺失 又 发 生 取 数 或 存 数 缺失 ,那么 ,这 条 指令 的 
执行 将 要 延长 多 个 缺失 损失 的 时 间 。 也 就 是 说 ,可 能 会 延长 几 十 到 几 百 个 时 钟 周期 。 在 流 
水 线 方式 下 ,这 会 大 大 阻塞 流水 线 的 执行 。 

23. 虚拟 存储 器 的 大 小 是 否 等 于 磁盘 的 容量 加 上 内 存 的 容量 ? 

答 : 不 是 。 虚 拟 存 储 器 本 身 只 是 一 个 概念 ,是 一 种 存储 管理 机 制 ,使 用 这 种 机 制 使 得 程 
序 员 编 写 程序 时 ,好 像 计算 机 内 部 有 一 个 极 大 的 存储 器 ,程序 在 这 个 极 大 的 存储 器 中 运行 ， 
而 不 受 内 存 大 小 的 限制 。 实 际 上 这 个 存储 器 在 物理 上 是 不 存在 的 ,因此 称 为 虚拟 存储 器 。 
虚拟 存储 器 的 大 小 就 是 虚拟 地 址 (或 称 逻 辑 地 址 ) 空 间 的 大 小 , 它 由 虚拟 (逻辑 ) 地 址 的 位 数 
决定 ,与 系统 中 所 安装 的 磁盘 容量 和 内 存 容 量 没 有 直接 的 关系 。 

24. 在 存储 器 层次 结构 中 ,cache 一 主 存 和 主 存 一 辅 存 这 两 个 层次 有 何 异 同 点 ? 

答 : 这 两 个 层次 在 以 下 几 个 方面 有 相同 的 地 方 : 四 都 是 基于 程序 访问 的 局 部 性 特点 ， 
把 一 块 相 邻 的 局 部 信息 从 慢 速 存储 器 复制 到 快速 存储 器 ; @ 都 必须 考虑 慢 速 存储 器 和 快速 
存储 器 之 间 的 映射 问题 ; @ 当 需要 在 快速 存储 器 中 装 入 新 的 块 而 对 应 位 置 已 满 时 ,都 需要 
考虑 把 哪 一 块 从 快速 存储 器 中 替换 出 来 ; 图 当 在 快速 存储 器 中 找 不 到 信息 时 ,都 要 从 慢 速 
存储 器 装 入 该 信息 所 在 块 到 快速 存储 器 中 。 

因为 这 两 个 层次 所 处 的 位 置 和 引入 的 目的 不 同 ,所 以 它们 之 间 也 存在 许多 不 同 之 处 : 
位 置 不 同 。cache 最 靠近 CPU , 辅 存 最 远离 CPU,CPU 可 以 直接 访问 cache 和 主 存 ,但 不 
能 直接 访问 辅 存 , 辅 在 和 主 存 直接 交换 数据 。@ 目 的 不 同 。 在 CPU 和 主 存 之 间 加 入 cache， 
目的 是 为 了 加 快 CPU 访问 信息 的 速度 ;而 在 主 存 一 辅 存 层次 采用 虚拟 存储 器 机 制 , 是 为 了 
使 程序 员 写 程序 时 不 受 内 存 容量 的 限制 , 即 扩 大 系统 的 存储 容量 。@ 交 换 的 信息 块 大 小 不 
同 。 在 cache 一 主 存 层次 ,交换 的 信息 块 称 为 主 存 块 (block) ,一 般 大 小 为 8 一 128B; 而 主 
存 一 辅 存 层次 ,交换 的 信息 块 称 为 页 (page) ,一 般 大 小 为 4KB~64KB。 随 着 技术 的 发 展 , 块 
大 小 也 可 能 会 变化 ,但 它们 之 间 在 数量 级 上 差别 很 大 。 因 为 虚拟 页 的 缺失 损失 比 cache 缺 
失 损失 大 得 多 ,所 以 页 太 小 会 影响 命中 率 , 从 而 极 大 降低 系统 效率 。 针 缺失 处 理 不 同 。 在 
cache 一 主 存 层次 ,缺失 处 理由 处 理 器 (硬件 ) 来 实现 ;而 在 主 存 一 辅 存 层次 , 则 由 操作 系统 
(软件 ) 来 实现 。 回 映射 方式 不 同 。 在 cache 一 主 存 层次 ,可 根据 不 同 的 情况 选择 使 用 直接 、 
全 相 联 或 组 相 联 方式 ,映射 关系 完全 由 硬件 实现 ,使 用 cache 行 中 的 标志 (Tag) 字 段 来 描述 ， 
而 在 主 存 一 辅 存 层次 , 则 都 采用 全 相 联 方式 ,映射 关系 由 操作 系统 实现 ,使 用 页 表 来 描述 映 
射 关系 。@ 写 策略 不 同 。 在 cache 一 主 存 层次 ,可 以 采用 直 写 和 回 写 两 种 策略 ;但 在 主 存 一 
辅 存 层次 , 则 都 采用 回 写 策略 。 因 为 ,如 果 采 用 直 写 ,每 次 写 操作 都 要 访问 磁盘 ,这 样 的 开销 
是 不 能 容忍 的 。 

25. 所 有 程序 都 使 用 同样 的 虚拟 地 址 空间 ,会 不 会 发 生 信息 被 互相 读 写 的 情况 呢 ? 

答 : 不 会 。 虚 拟 存储 机 制 的 引入 ,使 得 每 个 程序 员 可 以 在 一 个 很 大 的 虚拟 地 址 空间 中 
编写 程序 ,不 必 考虑 主 存 有 多 大 ,也 不 必 考虑 其 他 程序 用 的 地 址 是 否 和 自己 用 的 地 址 有 冲 
突 。 也 就 是 说 ,每 个 程序 员 都 在 一 个 同样 大 小 的 虚拟 地 址 空间 中 写 程 序 。 用 户 程序 被 加 载 
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之 前 ,操作 系统 内 核 会 将 该 程序 先生 成 一 个 新 进程 ,每 个 用 户 进 程 在 加 载 时 都 被 映射 到 一 个 
统一 的 虚拟 地 址 空间 中 ,因而 所 有 用 户 进程 所 用 的 虚拟 地 址 空间 大 小 是 一 样 的。 在 进程 执 
行 过 程 中 ,操作 系统 会 按照 某 种 存储 管理 机 制 (分 段 、 分 页 、 段 页 ) 把 当前 需要 的 用 户 程序 的 
一 部 分 从 磁盘 调 到 内 存 中 ,并 把 存放 的 物理 地 址 信息 记录 到 段 表 或 页 表 中 。 在 每 一 条 指令 
的 执行 过 程 中 ,CPU 进行 虚拟 地 址 到 物理 地 址 的 转换 。 因 此 ,CPU 访问 信息 的 真正 地 址 是 
内 存 物 理 地 址 。 所 以 ,虽然 两 个 用 户 程序 中 用 到 的 逻辑 地 址 可 能 是 一 样 的 ,但 由 于 两 个 用 户 
程序 被 存放 到 了 不 同 的 内 存 区 ,因而 ,不 会 发 生 信息 被 互相 读 写 的 问题 ,即使 由 于 程序 错误 
而 导致 这 种 问题 也 很 容易 被 发 现 。 

26. 装 入 一 个 新 的 页 面 时 ,内 存 没有 空闲 块 ,怎么 办 ? 

答 : 装 和 一 个 新 页 时 ,需要 到 内 存 找 一 个 空闲 页 框 。 如 果 内 存 没有 空闲 页 框 , 则 必须 选 
择 一 个 页 面 从 主 存 的 某 个 页 框 中 替换 出 来 。 

27. 怎么 知道 要 找 的 指令 或 数据 不 在 内 存 ? 

答 : 对 指令 的 访问 实际 上 就 是 指 每 条 指令 执行 过 程 中 的 取 指令 操作 ,而 对 数据 的 访问 
实际 上 就 是 执行 指令 过 程 中 的 读 取 操作 数 或 写 结果 的 操作 。 所 谓 要 找 的 指令 或 数据 不 在 内 
存 , 实 际 上 就 是 在 取 某 条 指令 或 存 取 某 个 数据 时 发 生 了 缺 页 情况 。 是 否 缺 页 主要 是 通过 查 
看 对 应 页 表 项 中 的 有 效 位 是 否 为 0 来 判断 。 大 致 过 程 如 下 : 根据 要 找 的 指令 或 操作 数 的 地 
址 高 位 ,确定 所 访问 的 虚 页 号 ,以 虚 页 号 作为 索引 值 ,找到 对 应 的 页 表 项 ,每 个 页 表 项 中 都 有 
一 个 有 效 位 , 若 为 0 表示 该 页 ( 即 指令 或 数据 所 在 的 页 ) 不 在 内 存 ,发 生 了 缺 页 异常 。 

28. 每 次 进行 内 存 访问 时 ,总 是 先 要 进行 逻辑 地 址 到 物理 地 址 的 转换 吗 ? 

答 : 如 果 采 用 的 是 动态 重 定位 ( 即 指令 中 给 定 的 是 逻辑 地 址 ) ,那么 ,执行 指令 过 程 中 如 
果 进 行内 存 访问 , 则 总 是 先 要 进行 旭 辑 地 址 到 物理 地 址 的 转换 。 如 果 采 用 的 是 静态 重 定位 
( 即 指令 中 已 经 给 出 了 物理 地 址 ), 则 内 存 访问 时 不 需要 进行 逻辑 地 址 到 物理 地 址 的 转换 。 

29. 逻辑 地 址 到 物理 地 址 的 转换 是 由 硬件 实现 的 还 是 软件 实现 的 ? 

答 : 动态 重 定位 方式 下 ,由 专门 的 存储 器 管理 部 件 (MMU) 实 现 多 辑 地 址 到 物理 地 址 的 
转换 。 静 态 重 定位 方式 下 ,由 链接 程序 或 加 载 程序 实现 地 址 转换 。 

30. 快 表 (TLB) 在 主 存 还 是 在 高 速 缓存 中 ? 

答 : 主 存 是 由 慢 速 的 DRAM 芯片 实现 的 ,为 了 尽量 避免 到 主 存 访问 页 表 , 通 常 把 最 近 
经 常 访问 的 页 表 项 放 到 一 个 特殊 的 高 速 缓存 (由 快速 的 SRAM 实现 ) 中 ,这 个 存放 若干 页 表 
项 的 特殊 cache 称 为 快 表 (CTLB) 。 所 以 , 快 表 在 高 速 缓存 中 。 

31. CPU 执行 指令 进行 一 次 存储 访问 操作 要 存 取 几 次 内 存 ? 

答 : 在 具有 cache 并 采用 动态 重 定位 存储 管理 的 系统 中 ,其 大 致 过 程 如 下 : 

(1) 根据 虚 页 号 查 快 表 , 若 快 表 中 有 对 应 页 的 页 表 项 , 则 取出 页 框 号 形成 物理 地 址 , 转 
(2); 若 快 表 中 不 存在 对 应 页 的 页 表 项 , 则 发 生 TLB 缺失 , 转 (3)。 

(2) 判断 物理 地 址 中 的 标记 是 否 和 cache 中 标记 相等 并 且 有 效 位 是 否 为 1, 若 是 , 则 
cache 命中 ,从 cache 取 数 或 写 数据 到 cache( 直 写 方式 同时 也 写 主 存 ) ; 若 不 是 , 则 发 生 cache 
缺失 , 转 (4) 。 

(3) 当 TLB 缺失 时 ,根据 页 表 基 址 寄存 器 的 值 和 虚 页 号 找到 主 存 中 的 页 表 项 ,判断 有 
效 位 是 否 为 1 ,若是 , 则 说 明 该 页 在 主 存 中 ,把 该 页 的 页 表 项 装 入 TLB 中 ,并 取出 页 框 号 形 
成 物理 地 址 , 转 (2) ;车 不 是 , 则 说 明 该 页 不 在 主 存 中 ,发 生 了 缺 页 异常 。 此 时 ,需要 调 出 操作 
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系统 中 的 缺 页 异常 处 理 程序 ,实现 从 磁盘 读 入 一 个 页 面 的 功能 。 缺 页 处 理 结束 后 ,重新 执行 
当前 指令 。 此 时 ,一 定 能 在 主 存 中 找到 需 访问 的 信息 。 

(4) 当 cache 缺失 时 , 则 CPU 根据 物理 地 址 到 主 存 读 一 块 信息 到 cache, 然 后 再 取 到 
CPU 或 CPU 写 信息 到 cache。 

从 上 述 过 程 来 看 ,CPU 进行 一 次 存储 访问 操作 ,最 好 的 情况 下 (TLB 命中 cache 命 
中 ) ,无 须 访问 内 存 ; 最 坏 的 情况 下 ( 缺 页 ) ,不 仅 要 多 次 访问 内 存 , 还 要 读 写 磁盘 数据 。 

32. 具有 TLB、cache 和 虚拟 存储 器 的 计算 机 系统 中 ,有 没有 可 能 出 现 “cache 命中 但 缺 
页 ”的 情况 ?“TLB 命中 但 缺 页 ”的 情况 有 没有 可 能 发 生 呢 ? 

答 : 不 可 能 出 现 “cache 命中 但 缺 页 ”的 情况 。 如 果 缺 页 ,说 明 当 前 页 不 在 主 存 中 ,那么 ， 
也 一 定 不 在 cache 中 。 同 样 ,“TLB 命中 但 缺 页 ”的 情况 也 不 可 能 发 生 。 因 为 若 当前 页 不 在 
主 存 中 ,那么 ,TLB 中 不 可 能 有 该 页 对 应 的 有 效 页 表 项 。 

33,TLB 缺失 .cache 缺失 和 页 面 缺失 ( 缺 页 ) 的 处 理 有 什么 异同 点 ? 

答 :, cache 缺失 的 处 理 是 由 硬件 来 实现 的 。 当 发 生 cache 缺失 时 ,CPU 使 当前 指令 阻 
塞 , 并 根据 主 存 地 址 继续 到 主 存 中 去 访问 主 存 块 , 从 主 存 中 取 到 信息 后 指令 继续 执行 ,因而 
CPU 不 会 切换 到 其 他 程序 执行 。 

TLB 缺失 可 以 用 软件 也 可 以 用 硬件 来 处 理 , 处 理 过 程 相当 简单 ,只 要 根据 虚 页 号 和 页 
表 基 址 寄存 器 的 内 容 到 主 存 中 找到 相应 的 页 表 项 。 若 有 效 位 为 1, 则 把 该 项 取 到 TLB 中 即 
可 ; 若 有 效 位 为 0, 则 发 出 缺 页 异常 。 如 果 用 软件 来 处 理 TLB 缺失 , 则 通过 产生 TLB 缺失 
异常 ,引出 操作 系统 中 相应 的 异常 处 理 程序 进行 处 理 ,异常 处 理 结束 后 ,重新 执行 当前 指令 。 

页 面 缺 失 ( 缺 页 ) 处 理 是 由 软件 来 实现 的 。 缺 页 时 ,需要 调 出 操作 系统 中 的 缺 页 异常 处 
理 程序 进行 处 理 , 实 现 从 磁盘 读 人 一 个 页 面 的 功能 。 缺 页 处 理 结束 后 ,重新 执行 当前 指令 。 

34. 存储 器 分 层 结 构 中 ,各 层次 上 的 存储 器 的 速度 如 何 ? 

答 : 在 计算 机 系统 中 ,存储 器 采用 的 是 一 种 分 层 结 构 , 包 括 寄存 器 一 cache 一 主 存 一 磁 
盘 。 它 们 之 间 的 相对 速度 若 用 一 个 CPU 时 钟 周期 来 表示 的 话 , 则 1 个 时 钟 周期 不 到 就 能 从 
寄存 器 访问 到 信息 ,1 一 10 个 时 钟 周期 能 够 在 cache 中 访问 到 信息 ,50 一 100 个 时 钟 周期 能 
在 主 存 中 访问 到 信息 ;如 果 要 从 磁盘 读 信息 , 则 大 约 需要 几 十 万 到 几 百 万 个 时 钟 周期 。 因 
此 ,程序 员 必 须 能 够 充分 理解 存储 器 的 分 层 结构 , 它 对 程序 的 性 能 有 巨大 的 影响 。 随 着 技术 
的 进步 ,各 类 存储 器 的 速度 可 能 会 发 生变 化 ,但 它们 之 间 的 差异 总 是 存在 的 。 


7.5 单项 选择 题 


1. 下 面 有 关 半 导体 存储 器 组 织 的 叙述 中 ,错误 的 是 (  )。 

A. 存储 器 的 核心 部 分 是 存储 阵列 ,由 若干 存储 单元 构成 

B. 存储 单元 由 若干 个 存放 0 或 1 的 存储 元 件 构成 

C. 一 个 存储 单元 有 一 个 编号 ,就 是 存储 单元 的 地 址 

D. 同一 个 存储 器 中 ,每 个 存储 单元 的 宽度 可 以 不 同 
2. ( ， ) 是 目前 已 被 淘汰 的 存储 器 。 

A. 半导体 存储 器 ”B. 磁 表 面 存储 器 C. 磁 芯 存储 器 D. 光盘 存储 器 
车 


3. 若 计 算 机 的 主 存储 器 容量 为 1GB, 也 就 等 于 ( ”)。 
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A. 23B B. 10?B 人 二 D. 10?*B 
4. 某 SRAM 芯片 ,其 容量 为 1024X4 位 , 则 地 址 和 数据 引 脚 的 数目 分 别 为 (  )。 章 
A. 10 和 4 B. 5 和 4 C. 10 和 8 D. 5 和 8 





5. 某 计 算 机 字 长 16 位 , 主 存 地 址 空间 大 小 是 64KB, 按 字 节 编 址 , 则 寻 址 范围 是 
(hs 
A. 0~(64K 一 1) B. 0~(32K 一 1) C. 0~(64KB 一 1) D. 0~(32KB 一 1) 
6. EPROM 是 指 ( 。 )。 


A. 读 写 存储 器 B. 掩 膜 只 读 存 储 器 

C. 可 编程 的 只 读 存 储 器 D. 可 擦 除 可 编程 的 只 读 存 储 器 
7. 下 列 几 种 存储 器 中 ,( ”) 是 易 失 性 存储 器 。 

A. cache B. EPROM C. Flash Memory D. CD-ROM 


8. 假定 主 存 地 址 空间 大 小 为 1024MB, 按 字 节 编 址 ,每 次 读 写 操作 最 多 可 以 一 次 存 取 
32 位 。 不 考虑 其 他 因素 , 则 存储 器 地 址 寄存 器 MAR 和 存储 器 数据 寄存 器 MDR 的 位 数 至 
少 应 分 别 为 (  )。 


A. 30 和 8 B. 30 和 32 C. 28 和 8 D. 28 和 32 
9 需要 定时 刷新 的 半导体 存储 器 芯片 是 ( 。 )。 

A. SRAM B，DRAM C. EPROM D. Flash Memory 
10. 通常 采用 行列 地 址 引 脚 复 用 的 半导体 存储 器 芯片 是 (  )。 

A. SRAM B. DRAM C. EPROM D. Flash Memory 


11. 具有 RAS( 行 地 址 选 通 ) 和 CAS( 列 地 址 选 通 ) 信号 引 脚 的 半导体 存储 器 芯片 是 


A. SRAM B. DRAM C. EPROM D. Flash Memory 
12. 下 面 有 关 ROM 和 RAM 的 叙述 中 ,错误 的 是 ( 。 “) 
A. RAM 是 可 读 可 写 存储 器 ,ROM 是 只 读 存 储 器 
B. ROM 和 RAM 都 采用 随机 访问 方式 进行 读 写 
C. 系统 的 主 存 由 RAM 和 ROM 组 成 
D. 系统 的 主 存 都 用 DRAM 芯片 实现 
13. 下 面 有 关 半 导体 存储 器 的 叙述 中 ,错误 的 是 (  )。 
A. 半导体 存储 器 都 采用 随机 存 取 方 式 进行 读 写 
B. ROM 芯片 属于 半导体 随机 存储 器 芯片 
C. SRAM 是 半导体 静态 随机 访问 存储 器 ,可 用 作 cache 
D. DRAM 是 半导体 动态 随机 访问 存储 器 ,可 用 作 主 存 
14. 假定 DDR3 SDRAM 芯片 内 部 核心 频率 为 133. 25MHz, 与 之 相连 的 存储 器 总 线 每 
次 传输 8B, 则 下 面 有 关 叙述 中 ,错误 的 是 (  )。 
A. 芯片 内 部 IO 缓冲 采用 8 位 预 取 技术 
B. 存储 器 总 线 每 秒 传 1066M 次 数据 
C. 存储 器 总 线 的 时 钟 频率 为 1066MHz 
D. 存储 器 总 线 的 带宽 大 约 为 8. 5GB/s 
15. 假定 用 若干 个 16KX1 位 的 存储 器 芯片 组 成 一 个 64KX8 位 的 存储 器 ,芯片 内 各 单 
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元 连续 编 址 , 则 地 址 BFFOH 所 在 的 芯片 的 最 小 地 址 为 ( Ys 
A. 4000H B. 6000H C. 8000H D. Aoo0H 
16. 假定 用 若干 个 16K X38 位 的 存储 器 芯片 组 成 一 个 64KX8 位 的 存储 器 ,芯片 内 各 单 
元 交叉 编 址 , 则 地 址 BFFFH 所 在 的 芯片 的 最 小 地 址 为 (  )。 
A. 0000H B. 0001H C. 0002H D. 0003H 
17. 用 存储 容量 为 16K X1 位 的 存储 器 芯片 组 成 一 个 64KX8 位 的 存储 器 , 则 在 字 方 向 
和 位 方向 上 分 别 扩展 了 (  ) 倍 。 


A. 4 和 2 B. 4 和 8 C. 2 和 4 D. 8 和 4 
18. 存储 容量 为 16KX4 位 的 DRAM 芯片 ,其 地 址 引 脚 和 数据 引 脚 数 各 是 (  )。 
A.7 和 1 B.7 和 4 C. 14 和 1 D. 14 和 4 
19. 多 模块 存储 器 所 以 能 高 速 进 行 读 / 写 ,是 因为 ( )。 
A. 采用 了 高 速 元 器 件 B. 各 模块 有 独立 的 读 写 电路 
C. 采用 了 信息 预 读 技术 D. 模块 内 各 单元 地 址 连续 


20. 相 联 存 储 器 是 按 ( 。 ”) 进 行 寻 址 访问 的 存储 器 。 
A. 地 址 指定 方式 ”B. 内 容 指 定 方式 ” C. 堆栈 访问 方式 ” D， 队列 访问 方式 
21. 在 存储 器 分 层 体系 结构 中 ,存储 器 速度 从 最 快 到 最 慢 的 排列 顺序 是 (。”)。 
A. 寄存 器 一 主 存 一 cache 一 辅 存 B. 寄存 器 一 主 存 一 辅 存 一 cache 
C. 寄存 器 一 cache 一 辅 存 一 主 存 D. 寄存 器 一 cache 一 主 存 一 辅 存 
22. 在 存储 器 分 层 体系 结构 中 ,存储 器 从 容量 最 大 到 最 小 的 排列 顺序 是 (  )。 
A. 主 存 一 辅 存 一 cache 一 寄存 器 B. 辅 存 一 cache 一 主 存 一 寄存 器 
C. 辅 存 一 主 存 一 cache 一 寄存 器 D. 辅 存 一 主 存 一 寄存 器 一 cache 
23. 在 主 存 和 CPU 之 间 增 加 cache 的 目的 是 ( 。 )。 
A. 增加 内 存 容量 B. 提高 内 存 可 靠 性 
C. 加 快 信息 访问 速度 D. 增加 内 存 容 量 , 同 时 加 快 访问 速度 
24. 以 下 (  ) 情 况 能 很 好 地 发 挥 cache 的 作用 。 
A. 程序 中 不 含有 过 多 的 IO 操作 
B. 程序 的 大 小 不 超过 实际 的 内 存 容量 
C. 程序 具有 较 好 的 访问 局 部 性 
D. 程序 的 指令 间 相 关 度 不 高 
25. 假定 主 存 地址 位 数 为 32 位 , 按 字 节 编 址 , 主 存 和 cache 之 间 采 用 直接 映射 方式 , 主 
存 块 大 小 为 1 个 字 , 每 字 32 位 , 写 操作 时 采用 直 写 (write through) 方 式 , 则 能 存放 32K 字数 
据 的 cache 的 总 容量 至 少 应 有 ( ) 位 。 
A. 1504K B. 1536K C. 1568K D. 1600K 
26. 假定 主 存 地 址 位 数 为 32 位 , 按 字 节 编 址 , 主 存 和 cache 之 间 采 用 直接 映射 方式 , 主 
存 块 大 小 为 1 个 字 , 每 字 32 位 , 写 操作 时 采用 回 写 (write back) 方 式 , 则 能 存放 32K 字数 据 
的 cache 的 总 容量 至 少 应 有 ( ) 位 。 
A. 1504K B. 1536K C. 1568K D. 1600K 
27. 假定 主 存 地 址 位 数 为 32 位 , 按 字 节 编 址 , 主 存 和 cache 之 间 采 用 全 相 联 映射 方式 ， 
主 存 块 大 小 为 1 个 字 , 每 字 32 位 ,采用 回 写 (write back) 方 式 和 随机 替换 策略 , 则 能 存放 
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32K 字数 据 的 cache 的 总 容量 至 少 应 有 ( ”“_) 位 。 
A. 1536K B. 1568K C. 2016K D. 2048K 
28. 假定 主 存 按 字 节 编 址 ,cache 共有 64 行 ,采用 直接 映射 方式 , 主 存 块 大 小 为 32B, 所 
有 编号 都 从 0 开始 。 主 存 第 2593 号 单元 所 在 主 存 块 对 应 的 cache 行 号 是 ( 。 )。 
证 于. 7 C. 34 D. 81 
29. 假定 主 存 按 字 节 编 址 ,cache 共有 64 行 ,采用 4 路 组 相 联 映射 方式 , 主 存 块 大 小 为 
32B, 所 有 编号 都 从 0 开始 。 主 存 第 2593 号 单元 所 在 主 存 块 对 应 的 cache 组 号 是 ( 。”)。 
A. 1 了 7 C. 34 D. 81 
30. 假定 CPU 通过 存储 器 总 线 读 取 数据 的 过 程 为 : 发 送 地 址 和 读 命令 需 1 个 时 钟 周 
期 ,存储 器 准备 一 个 数据 需 8 个 时 钟 周期 ,总 线 上 每 传送 1 个 数据 需 1 个 时 钟 周期 。 若 主 存 
和 cache 之 间 交 换 的 主 存 块 大 小 为 64B, 存 取 宽 度 和 总 线 宽度 都 为 4B, 则 cache 的 一 次 缺失 
损失 至 少 为 (  ) 个 时 钟 周期 。 
A. 64 B72 C. 80 D. 160 
31. 假定 CPU 通过 存储 器 总 线 读 取 数据 的 过 程 为 : 发 送 地 址 和 读 命令 需 1 个 时 钟 周 
期 ,存储 器 准备 一 个 数据 需 8 个 时 钟 周期 ,总 线 上 每 传送 1 个 数据 需 1 个 时 钟 周期 。 若 主 存 
和 cache 之 间 交 换 的 主 存 块 大 小 为 64B, 存 取 宽 度 和 总 线 宽度 都 为 8B, 则 cache 的 一 次 缺失 
损失 至 少 为 (  ) 个 时 钟 周 期 。 
A. 64 了 了 C. 80 D. 160 
32. 假定 采用 多 模块 交叉 存储 器 组 织 方式 ,存储 器 芯片 和 总 线 支 持 突 发 传送 ,CPU 通 
过 存储 器 总 线 读 取 数据 的 过 程 为 : 发 送 首 地 址 和 读 命令 需 1 个 时 钟 周期 ,存储 器 准备 第 一 
个 数据 需 8 个 时 钟 周期 ( 即 CAS 潜伏 期 =8) ,随后 每 个 时 钟 周期 总 线 上 传送 1 个 数据 ,可 连 
续 传送 8 个 数据 ( 即 突 发 长 度 =8)。 若 主 存 和 cache 之 间 交 换 的 主 存 块 大 小 为 64B, 存 取 宽 
度 和 总 线 宽度 都 为 8B, 则 cache 的 一 次 缺失 损失 至 少 为 (  ) 个 时 钟 周期 。 
A 0 B. 20 | 台 D. 65 
33, 以 下 是 有 关 虚 拟 存储 管理 机 制 中 地 址 转换 的 叙述 ,其 中 错误 的 是 (  )。 
A. 地 址 转换 是 指 把 逻辑 地 址 转换 为 物理 地 址 
B. 通常 好 辑 地 址 的 位 数 比 物理 地 址 的 位 数 少 
C. 地 址 转换 过 程 中 会 发 现 是 否 “ 缺 页 ” 
D. MMU 在 地 址 转换 过 程 中 要 访问 页 表 项 
34. 下 列 命中 组 合 情 况 中 ,一 次 访 存 过 程 中 不 可 能 发 生 的 是 (  )。 
A. TLB 命中 ,cache 命中 .Page 命中 
B. TLB 未 命中 .cache 命中 .Page 命中 
C. TLB 未 命中 、cache 未 命中 .Page 命中 
D. TLB 未 命中 ,cache 命中 、Page 未 命中 
35. 以 下 是 有 关 虚 拟 存储 管理 机 制 中 页 表 的 叙述 ,其 中 错误 的 是 (  )。 
A. 系统 中 每 个 进程 有 一 个 页 表 
B. 页 表 中 每 个 表 项 与 一 个 虚 页 对 应 
C. 每 个 页 表 项 中 都 包含 装 入 位 (有 效 位 ) 
D. 所 有 进程 都 可 以 访问 页 表 
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36. 以 下 是 有 关 缺 页 处 理 的 叙述 ,其 中 错误 的 是 (  )。 
A. 若 对 应 页 表 项 中 的 有 效 位 为 0, 则 发 生 缺 页 
B. 缺 页 是 一 种 外 部 中 断 ,需要 调用 操作 系统 提供 的 中 断 服务 程序 来 处 理 
C. 缺 页 处 理 过 程 中 需 根据 页 表 中 给 出 的 磁盘 地 址 去 读 磁盘 数据 
D. 缺 页 处 理 完 后 要 重新 执行 发 生 缺 页 的 指令 
37. 以 下 是 有 关 页 式 存储 管理 的 人 氢 述 ,其 中 错误 的 是 (  )。 
A. 进程 被 划分 成 等 长 的 页 ,内存 被 划分 成 同样 大 小 的 页 杠 
B. 采用 全 相 联 映射 ,每 个 页 可 以 映射 到 任何 一 个 空闲 的 页 框 中 
C. 当 从 磁盘 装 和 的 信息 不 足 一 页 时 会 产生 页 内 碎片 
D. 相对 于 段 式 存储 管理 ,分 页 式 更 利于 存储 保护 
38. 以 下 是 有 关 段 式 存储 管理 的 叙述 ,其 中 错误 的 是 (。”)。 
A. 段 是 逻辑 结构 上 相对 独立 的 程序 块 ,因此 段 是 可 变 长 的 
B. 按 程序 中 实际 的 段 来 分 配 主 存 ,所 以 分 配 后 的 存储 块 是 可 变 长 的 
C. 每 个 段 表 项 必须 记录 对 应 段 在 主 存 的 起 始 位 置 和 段 的 长 度 
D. 分 段 方式 对 低级 语言 程序 员 和 编译 器 来 说 是 透明 的 
39. 以 下 是 有 关 快 表 的 叙述 ,其 中 错误 的 是 (  )。 
A. 快 表 的 英文 缩写 是 TLB, 称 为 转换 后 援 缓冲 器 
B. 快 表 中 存放 的 是 当前 进程 的 常用 页 表 项 
C. 在 快 表 中 命中 时 ,在 Ll cache 中 一 定 命中 
D. 快 表 是 一 种 高 速 缓存 ,一 定 在 CPU 中 

40. 以 下 给 出 的 事件 中 , 无 需 异 常 处 理 程序 进行 处 理 的 是 (  )。 

A. 缺 页 故障 B. cache 缺失 C. 地 址 越界 D. 除数 为 0 

【参考 答案 】 

LD 2.C 3.A 4A 5A 6D 7.A 8B 9.B 10. 

ul. B12 D13 A i € SC€ i D 1 B 18B 19.B ‘20 

21. DD. 22C 2%C 24C 25.B 26C 27.D 28 B 229 A 30 

31.C 32.A 33.B 34.D 35.D 36.B 37.D 38.D 39.C 40. 

【部 分 题目 的 答案 解析 】 

1. 半导体 存储 器 中 用 于 存储 0 或 1 的 是 记忆 单元 (也 称 存储 元 ) ,每 个 记忆 单元 由 一 个 
存储 元 件 实现 ,所 有 存储 元 件 构成 一 个 存储 阵列 。 若 干 个 存储 元 件 构成 一 个 存储 单元 ,每 个 
存储 单元 有 一 个 地 址 ,因而 构成 同一 个 存储 单元 的 存储 元 件 的 地 址 是 相同 的 ,具有 相同 地 址 
的 存储 元 件 的 个 数 就 是 编 址 单位 。 例 如 , 若 编 址 单位 是 字 节 , 则 每 个 存储 单元 都 是 一 个 字 节 
的 宽度 。 综 上 所 述 , 选 项 D 的 说 法 是 错误 的 。 答 案 为 选项 D。 

4. 存储 器 芯片 的 容量 为 1024X4 位 ,说 明 有 1024 个 存储 单元 ,每 个 存储 单元 占 4 位 。 
SRAM 芯片 不 采用 地 址 引 脚 复 用 方式 ,因此 ,存储 单元 数 和 地 址 引 脚 数 的 关系 为 : 存储 单 
元 数 =2"。 因 此 ,答案 为 选项 A。 

5. 主 存 地 址 空间 大 小 是 64KB, 按 字 节 编 址 ,说 明 主 存 空间 中 的 存储 单元 数 为 64KB/ 
1B 王 64K ,计算 机 中 地 址 的 编号 总 是 从 0 开始 ,因此 , 寻 址 范围 是 0~(64K 一 1) ,答案 为 选 
项 A。 
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8. 主 存 地 址 空间 大 小 为 1024MB, 按 字 节 编 址 ,说 明 主 存 地 址 位 数 为 log; (1024MB/ 
1B) 王 30, 因 此 ,MAR 的 位 数 至 少 应 为 30。 因 为 每 次 读 写 操作 最 多 可 以 一 次 存 取 32 位 ,所 
以 MDR 的 位 数 至 少 应 为 32。 答 案 为 选项 B。 

12. 选项 D 的 说 法 是 错误 的 。 通 用 PC 系统 的 主 存 由 RAM 区 和 ROM 区 组 成 ,其 中 
RAM 区 一 般 都 用 DRAM 芯片 实现 ,ROM 区 则 用 相应 的 ROM 存储 元 件 实现 。 有 些 岩 入 
式 专用 系统 可 能 其 主 存 都 是 由 ROM 存储 元 件 实现 ,还 有 些 系统 也 会 用 SRAM 芯片 实现 内 
存 , 所 以 ,并 不 是 所 有 系统 的 内 存 都 是 由 DRAM 芯片 实现 的 。 答 案 为 选项 D。 

13. 有 些 半 导体 存储 器 可 以 采用 按 内 容 访问 方式 。 例 如 ,全 相 联 映射 的 cache 就 是 根 
据 标志 信息 (Tag) 来 访问 的 。 因 此 ,选项 A 的 说 法 是 错误 的 。 管 案 为 选项 A。 

14. 因为 是 DDR3 SDRAM 芯片 ,所 以 芯片 内 部 IO 缓冲 采用 8 位 预 取 技术 。 因 此 , 存 
储 器 总 线 每 秒 传送 数据 的 次 数 为 133. 25MX8= 二 1066M ,其 带宽 为 1066M X 8Bx8. 5GB/s。 
因为 存储 器 总 线 每 个 时 钟 周 期 传送 两 次 数据 ,所 以 ,其 时 钟 频率 为 1066M/2=533MHz。 综 
上 所 述 , 答 案 为 选项 C。 

15. 因为 64KX8 位 /16KX1 位 =4X8, 说 明 在 行 方向 ( 字 方 向 ) 扩 大 了 4 倍 。 因 为 芯片 
内 各 单元 连续 编 址 ,所 以 ,每 个 芯片 的 片 选 信号 由 最 高 两 位 地 址 确定 , 低 14 位 为 片 内 地 址 。 
4 个 芯片 的 地 址 范围 分 别 为 0000H~3FFFH、4000H~7FFFH、8000H~BFFFH、C000H~ 
FFFFH, 显 然 ,地 址 BFFOH 所 在 的 芯片 的 最 小 地 址 为 8000H。 答 案 为 选项 C。 

16. 因为 64KX8 位 /16KX8 位 =4X1, 说 明 在 行 方向 ( 字 方向 ) 扩 大 了 4 倍 。 因 为 芯片 
内 各 单元 交叉 编 址 ,所 以 ,每 个 芯片 的 片 选 信号 由 最 低 两 位 地 址 确定 ,高 14 位 为 片 内 地 址 。 
4 个 芯片 内 各 存储 单元 的 最 低 两 位 地 址 分 别 为 00、01、10、11, 最 小 地 址 分 别 为 0000H、 
0001H、0002H、0003H。 地 址 BFFFH 的 最 低 两 位 为 11 ,因此 ,该 存储 单元 所 在 芯片 的 最 小 
地 址 为 0003H。 答 案 为 选项 D。 

17. 存储 容量 为 16KX4 位 ,说 明 芯片 内 共有 16K 个 存储 单元 ,每 个 单元 有 4 个 数据 位 , 因 
而 其 地 址 为 14 位 ,DRAM 芯片 采用 行列 地 址 引 脚 复 用 技术 ,故地 址 引 脚 数 为 14/2 一 7, 数据 
引 脚 数 为 4, 答案 为 选项 B。 

25. 主 存 块 大 小 为 1 个 字 , 每 字 32 位 , 按 字 节 编 址 ,因而 块 内 地 址 占 两 位 ;cache 共有 
32K 字数 据 , 采 用 直接 映射 方式 ,因而 cache 共有 32K 字 /1 字 =32K 行 , 故 cache 行 号 占 
15 位 ; 主 存 地 址 位 数 为 32 位 ,所 以 ,标志 Tag 占 32 一 15 一 2 一 15 位 。 因 为 采用 直 写 (write 
throught) 方 式 , 故 无 需 修改 位 (dirty bit) 。 综 上 所 述 ,cache 的 总 容量 至 少 应 有 32KX (1 十 
15 十 32) 二 1536K 位 。 答 案 为 选项 B。 

26. 如 第 24 题 所 述 , 块 内 地 址 占 两 位 ,标志 占 32 一 15 一 2 一 15 位 。 因 为 采用 回 写 (write 
back) 方 式 , 故 需 一 位 修改 位 。 综 上 所 述 ,cache 的 总 容量 至 少 应 有 32KX (1 十 15 十 32 十 1)= 
1568K 位 。 答 案 为 选项 C。 

27. 如 第 24 题 所 述 , 块 内 地 址 占 两 位 ,全 相 联 映射 方式 下 , 主 存 地 址 只 包含 两 个 字段 , 故 
标志 占 32 一 2 一 30 位 。 因 为 采用 回 写 (write back) 方 式 , 故 需 一 位 修改 位 ;因为 采用 随机 替换 策 
略 , 故 无 须 蔡 换 控 制 位 。 综 上 所 述 ,cache 的 总 容量 至 少 应 有 32KX (1 十 30 十 32 十 1) 一 2048K 
位 。 答 案 为 选项 D。 

28. 因为 按 字 节 编 址 , 主 存 块 大 小 为 32B, 所 以 块 内 地 址 占 5 位 。 采 用 直接 映射 方式 ， 
共 64 行 , 故 行 号 占 6 位 。 因 为 2593=0…01 010001 00001B, 根 据 主 存 地 址 划分 的 结果 ,可 
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以 看 出 2593 单元 所 在 主 存 块 对 应 的 cache 行 号 为 010001B=17。 答 案 为 选项 B。 

29. 因为 按 字 节 编 址 , 主 存 块 大 小 为 32B, 所 以 块 内 地 址 占 5 位 。 采 用 4 路 组 相 联 映射 
方式 , 共 64 行 ,分 64/4=16 组 , 故 组 号 占 4 位 。 因 为 2593 王 0..0101 0001 00001B, 根 据 主 
存 地址 划分 的 结果 ,可 以 看 出 2593 单元 所 在 主 存 块 对 应 的 cache 组 号 为 0001B 王 1。 答 案 为 
选项 A。 

30. 一 次 缺失 损失 需要 从 主 存 读 出 一 个 主 存 块 (64B) ,每 个 总 线 事务 读 取 4B, 因 此 , 需 
要 64B/4B=16 个 总 线 事务 。 每 个 总 线 事务 所 用 时 间 为 1 十 8 十 1=10 个 时 钟 周期 ,总 共 需 
要 160 个 时 钟 周 期 。 答 案 为 选项 D。 

31. 一 次 缺失 损失 需要 从 主 存 读 出 一 个 主 存 块 (64B) ,每 个 总 线 事务 读 取 8B, 因 此 , 需 
要 64B/8B=8 个 总 线 事务 。 每 个 总 线 事务 所 用 时 间 为 1 十 8 十 1 二 10 个 时 钟 周 期 ,总 共 需 要 
80 个 时 钟 周期 。 答 案 为 选项 C。 

32. 一 次 缺失 损失 需要 从 主 存 读 出 一 个 主 存 块 (64B) ,每 个 突 发 传送 总 线 事务 可 读 取 
8BX8 二 64B, 因 此 ,只 需要 一 个 突 发 传送 总 线 事务 。 每 个 突 发 传送 总 线 事务 所 用 时 间 为 1 十 
8 十 8 二 17 个 时 钟 周期 ,因此 总 共 只 需要 17 个 时 钟 周 期 。 答 案 为 选项 A。 

33. 最 初 提出 分 页 式 虚拟 存储 管理 的 目的 是 为 了 让 程序 员 可 以 在 一 个 比 主 存 地址 空间 
大 得 多 的 虚拟 (逻辑 ) 地 址 空间 中 写 程序 ,显然 ,逻辑 地 址 空间 比 主 存 大 ,因而 迎 辑 地 址 位 数 
比 物理 地 址 位 数 多 。 在 执行 程序 时 ,由 CPU 中 的 MMU 进行 虚拟 (逻辑 ) 地 址 到 主 存 ( 物 
理 ) 地 址 的 转换 ,在 进行 转换 过 程 中 ,MMU 需要 查找 对 应 的 页 表 项 ,根据 页 表 项 中 的 装 入 
(有 效 ) 位 是 否 为 1 来 确定 是 否 发 生 了 缺 页 。 综 上 所 述 ,选项 B 的 说 法 是 错误 的 ,其 他 都 是 
对 的 。 管 案 为 选项 B。 

36, 显然 ,选项 B 的 说 法 是 错误 的 。 缺 页 是 在 CPU 执行 某 条 指令 过 程 中 进行 取 指 令 或 
读 写 数据 时 发 生 的 一 种 故障 ,而 不 是 由 CPU 外 部 向 CPU 提出 的 一 种 外 部 中 断 请 求 。 答 案 
为 选项 B。 

40. 缺 页 地址 越界 和 除数 为 0 都 是 执行 某 条 指令 时 发 生 的 故障 ,需要 调 出 操作 系统 内 
核 中 相应 的 异常 处 理 程序 来 处 理 , 而 cache 缺失 由 CPU 进行 处 理 ,无 须 调 出 异常 处 理 程序 
进行 处 理 。 答 案 为 选项 B。 


7.6 分 析 应 用 题 


1. 假定 某 计 算 机 的 主 存 地 址 空间 大 小 为 512MB, 按 字 节 编 址 。 若 每 次 读 写 操作 最 多 
可 以 存 取 32 位 , 则 存储 器 地 址 寄存 器 MAR 和 存储 器 数据 寄存 器 MDR 的 位 数 至 少 分 别 为 
多 少 ? 

【分 析 解 答 】 

主 存 地 址 空间 大 小 为 512MB, 按 字 节 编 址 ,说 明 每 个 存储 单元 有 8 位 ,共有 512X22 一 
22 个 存储 单元 。 所 以 ,地 址 位 数 至 少 应 有 29 位 , 故 存放 主 存 地 址 的 存储 器 地 址 寄存 器 
MAR 至 少 应 有 29 位 。 每 次 读 写 最 多 存 取 32 位 ,因此 ,用 来 作为 读 / 写 数据 缓冲 的 存储 器 
数据 寄存 器 MDR 的 位 数 至 少 应 有 32 位 。 

2. 某 计 算 机 主 存 地 址 16 位 ,每 个 存储 单元 有 8 位 , 即 按 字 节 编 址 。 如 果 用 1KX4 位 的 
RAM 芯片 构成 该 存储 器 ,需要 多 少 芯 片 ? 片 选 逻辑 的 输入 需要 多 少 位 地 址 ? 
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【分 析 解 答 】 

主 存 地址 为 16 位 ,所 以 主 存 地 址 空间 大 小 为 下 一 64K 个 存储 单元 ,每 个 存储 单元 占 
8 位 。 因 此 需要 的 芯片 数 为 (64K/IK) X (8/4) 二 64X2 二 128。 存 储 器 在 字 方 向 上 扩展 了 
64 倍 , 因 而 片 选 逻辑 需要 6 位 地 址 。 每 个 芯片 有 1K 王 1024 一 22 个 单元 ,所 以 芯片 内 地 址 位 
数 为 10 位 , 剩 下 6 位 地 址 正好 用 于 片 选 逮 辑 。 

3. 构成 256KX8 位 的 存储 器 , 需 多 少 个 64KX1 位 的 DRAM 芯片 ? 存储 器 所 有 单元 
刷新 一 遍 需 要 多 少 次 刷新 操作 ?车 采用 异步 刷新 方式 ,每 单元 刷新 间隔 不 超过 2ms, 则 生成 
的 刷新 信号 的 间隔 时 间 是 多 少 ? 若 采用 集中 刷新 方式 , 则 存储 器 刷新 一 遍 最 少 用 多 少 个 读 / 
写 周 期 ? 若 改 用 16KX4 位 的 DRAM 芯片 构成 上 述 256KX8 位 的 存储 器 , 则 存储 器 所 有 单 
元 刷新 一 遍 需要 多 少 次 刷新 操作 ? 

【分 析 解 答 】 

该 存储 器 所 需 芯片 数 为 (256K/64K) X(8/1)=4X8=32。 因 为 所 用 芯片 为 64KX1 位 
的 DRAM 芯片 ,因而 芯片 中 只 有 一 个 位 平面 ,256X256 的 存储 阵列 结构 构成 了 64K 个 单 
元 ,构成 存储 器 的 所 有 芯片 同时 按 行 刷新 ,每 个 芯片 有 256 行 ,所 以 存储 器 所 有 单元 刷新 一 
遍 至 少 需 要 256 次 刷新 操作 。 若 采用 异步 刷新 方式 , 则 相 邻 两 次 刷新 信息 产生 的 时 间 间 隔 
为 2ms/256 六 7. 8ps。 若 采用 集中 刷新 方式 , 则 整个 存储 器 刷新 一 遍 最 少 用 256 个 读 / 写 周 
期 ,在 这 个 过 程 中 ,存储 器 不 能 进行 读 写 操作 。 

若 改 用 16KX4 位 的 DRAM 芯片 , 则 每 个 芯片 中 的 存储 阵列 由 4 个 128X128 的 位 平 
面 构成 , 则 4 个 存储 阵列 中 行 号 相同 的 那些 行 同 时 被 刷新 ,共有 128 行 ,因而 整个 存储 器 刷 
新 一 遍 只 需要 128 次 刷新 操作 。 

4. 某 计算 机 的 主 存 地 址 空间 大 小 为 64KB, 按 字 节 编 址 ,已 配 有 0000H~7FFFH 的 
ROM 区 , 若 再 用 8KX4 位 的 RAM 芯片 形成 其 余 32KX8 位 的 RAM 存储 区 , 则 需要 多 少 
个 这 样 的 RAM 芯片 ? 假定 将 该 计算 机 的 主 存 地 址 空间 升级 为 16MB,ROM 区 地 址 范围 还 
是 000000H~007FFFH, 剩 下 的 所 有 地 址 空间 都 用 8KX4 位 的 RAM 芯片 配置 , 则 需要 多 
少 个 这 样 的 RAM 芯片 ? 

【分 析 解 答 】 

因为 主 存 地 址 空间 为 64KB, 按 字 节 编 址 ,所 以 主 存 地 址 范围 为 0000H~FFFFH, 其 中 
0000H~7FFFH 为 ROM 区 ,8000H~FFFFH 为 RAM 区 ,也 即 , 当 Ais 为 0 时 选中 ROM 
芯片 , 当 Ais 为 1 时 选中 RAM 芯片 。 因 为 RAM 区 的 大 小 为 32KB, 故 需 SKX4 位 的 RAM 
芯片 数 为 32KB/(8KX4b)=4X2=8。 

车 主 存 地 址 空间 升级 为 16MB 时 , 主 存 地 址 为 24 位 , ROM 区 范围 为 000000H 一 
007FFFH, 其 大 小 为 32KB, 主 存 空 间 总 大 小 为 16MB==512X 32KB, 所 以 RAM 区 大 小 为 
511X32KB, 需 使 用 的 RAM 芯片 数 为 511 X32KB/(8KX4b)=511X4X2==4088。 

5. 假设 CPU 有 16 个 地 址 引 脚 ,8 个 数据 引 脚 ,并 用 MREQ 作 为 访 存 控制 信号 ( 低 电 平 
有 效 ) ,用 WR 作为 读 / 写 控制 信号 ( 低 电 平 为 写 ,高 电 平 为 读 )。 现 有 以 下 规格 的 存储 器 芯 
片 : IKX4 位 RAM.4KX8 位 RAM.1KX8 位 ROM、4KX8 位 ROM, 另 外 有 74LS138 译 
码 器 和 各 种 门 电路 。 主 存 地 址 空间 分 配 为 : 6000H~67FFH 为 ROM 区 ,6800H~6BFFH 
为 RAM 区 ,其余 为 备用 区 , 暂 不 连接 芯片 。 请 画 出 CPU 与 存储 器 的 连接 图 ,并 详细 画 出 片 
选 逻 辑 。 
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【分 析 解 答 】 
第 一 步 : 将 十 六 进 制 地 址 写成 对 应 的 二 进 制 地 址 形式 。 
Ai5AN4ANDADANAloAs As AT A6 As A4 Ai As Al An 


01|I100I00000000000 
， | ROM 区 
2KX8 位 
a 
ee 
: | RAM 区 
1IKX8 位 
和 

第 二 步 : 选择 芯片 。ROM 区 选择 2 片 1KX8 位 ROM 芯片 ,RAM 区 选择 2 片 IKX4 位 
RAM 芯片 。 选 其 他 芯片 都 不 合理 。 

第 三 步 : 地 址 线 的 连接 。 对 于 1KX8 位 的 ROM 芯片 和 1KX4 位 的 RAM 芯片 来 说 ， 
其 芯片 内 的 地 址 引 脚 都 为 10 位 ,因此 ,每 个 芯片 的 地 址 引 脚 都 分 别 与 地 址 线 Ay As A; As 
As A, A A; Al Au 相连 。 剩 下 的 高 位 地 址 线 和 访 存 控制 信号 MREQ 共 同 产生 片 选 信号 。 

第 四 步 : 片 选 信号 的 形成 。 按 本 题 要 求 ,Ais Au =01,ROM 区 的 As As Au =100， 
RAM 区 的 As As An As=1010。74LS138 译 码 器 要 求 控制 端 G1 为 高 ,Gs 与 Ga 为 低 , 因 
此 可 把 它们 分 别 接 到 Al 、Ais 和 MREQ 上 。 地 址 线 Als As An 可 作为 译 码 器 的 C.B、A 输入 


端 。 最 终 的 片 选 信号 由 译 码 器 输出 信号 和 地 址 线 Ai 组 合生 成 。 具 体 的 连接 如 图 7. 1 所 
示 , 其 中 CS 为 片 选 信号 。 
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7.1 题 5 中 CPU 与 存储 芯片 的 连接 


6. 假定 一 个 存储 器 系统 支持 4 体 交 叉 存 取 , 某 程序 执行 过 程 中 ,CPU 访问 的 主 存 地 址 


疮 储 器 分 层 体 系 结构 


序列 为 3, 9, 17, 2, 51, 37, 13, 4, 8, 41, 67, 10, 则 哪些 地 址 访问 会 发 生体 冲突 ? 

【分 析 解 答 】 

对 于 4 体 交 叉 访问 的 存储 系统 ,理想 情况 下 ,每 隔 1/4 周期 可 读 写 一 个 数据 ,假定 这 个 
时 间 为 At。 每 个 存储 模块 内 的 地 址 分 布 如 下 。 

模块 0: 0.4.8、12、16、… 

模块 1; 1.5.9.13、.17、…、37、…、41、…。 

模块 2: 2、6、10、14、18、… 

模块 3: 3.7、.11.15、.19、…、51、…、67、… 

很 显然 ,如 果 相 邻 4 次 访问 中 给 定 的 访 存 地 址 出 现在 同一 个 模块 内 ,就 会 发 生 访 存 冲 
突 。 所 以 17 和 9.37 和 17.13 和 37.8 和 4 会 发 生 冲 突 。41 和 13 也 在 同一 个 模块 内 且 访 问 
间隔 小 于 4 个 At, 但 是 ,由 于 访问 第 8 单元 发 生 冲 突 而 使 其 访问 延迟 3 个 At 进行 ,从 而 使 得 
41 号 单元 也 延迟 3 个 At 访问 ,因而 ,其 访问 不 会 和 13 号 单元 的 访问 发 生 冲 突 。 

7. 现代 计算 机 中 ,SRAM 一 般 用 于 实现 快速 小 容量 的 cache, 而 DRAM 用 于 实现 慢 速 
大 容量 的 主 存 。 以 前 超级 计算 机 通常 不 提供 cache, 而 是 用 SRAM 来 实现 主 存 (如 Cray 巨 
型 机 ) 。 如 果 不 考 虑 成 本 ,你 会 这 样 设计 高 性 能 计算 机 吗 ? 为 什么 ? 

【分 析 解 答 】 

不 会 。 其 理由 主要 有 以 下 两 个 方面 ， 

(1) 主 存 越 大 越 好 , 主 存 大 , 缺 页 率 降低 ,因而 减少 了 访问 磁盘 所 需 的 时 间 。DRAM 芯 
片 的 集成 度 比 SRAM 芯片 的 高 得 多 ,因而 ,用 DRAM 芯片 比 用 SRAM 芯片 构成 的 主 存 容 
量 大 得 多 。 

(2) 程序 访问 的 局 部 性 特点 使 得 cache 的 命中 率 很 高 ,因而 ,CPU 访问 的 主要 是 cache， 
对 主 存 的 访问 不 多 ,而 且 现代 DRAM 芯片 中 也 有 SRAM 构成 的 高 速 缓存 区 。 因 此 即使 主 
存 没有 用 快速 的 SRAM 芯片 而 是 用 DRAM 芯片 ,也 不 会 对 存储 访问 速度 有 多 大 影响 。 

8. 某 计 算 机 主 存 地 址 空间 大 小 有 8MB, 分 成 32 768 个 主 存 块 , 按 字 节 编 址 。cache 可 
存放 8KB 数据 (不 包括 有 效 位 标记 等 附加 信息 ), 采 用 直接 映射 方式 。cache 共有 多 少 行 ? 
主 存 地 址 如 何 划分 ? 要 求 说 明 每 个 字段 的 含义 .位 数 和 在 主 存 地 址 中 的 位 置 。 

【分 析 解 答 】 

每 个 主 存 块 大 小 为 8MB/32 768 二 256B, 故 cache 共有 8KB/256B==32 行 。 直 接 映射 方 
式 下 ,cache 行 号 (即行 索引 ) 有 5 位 ;由 于 每 个 主 存 块 大 小 为 256B, 按 字 节 编 址 , 故 块 内 地 址 
为 8 位 ; 主 存 地 址 空间 大 小 为 8SMB, 所 以 地 址 位 数 为 23 位 , 故 主 存 地 址 中 标记 有 23 一 5 一 
8=10 位 。 综 上 所 述 , 主 存 地 址 共有 以 下 三 个 字段 : 高 10 位 为 标记 字段 ,中间 5 位 为 行 索引 ， 
低 8 位 为 块 内 地 址 。 

9. 某 计算 机 主 存 地 址 空间 大 小 为 1GB, 按 字 节 编 址 。cache 可 存放 64KB 数据 , 主 存 块 
大 小 为 128B, 采 用 直接 映射 和 直 写 (write through) 方 式 。 请 回答 下 列 问题 

(1) 主 存 地 址 如 何 划 分 ?要求 说 明 每 个 字段 的 含义 ,位 数 和 在 主 存 地 址 中 的 位 置 。 

(2) cache 的 总 容量 为 多 少 位 ? 

【分 析 解 答 】 

(1) cache 共 有 64KB/128B==512 行 ,直接 映射 方式 下 ,cache 行 号 占 9 位 ;由 于 每 个 主 
存 块 大 小 为 128B, 按 字 节 编 址 , 故 块 内 地 址 为 7 位 ; 主 存 地 址 空间 大 小 为 1GB, 所 以 主 存 地 
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址 位 数 为 30 位 。 主 存 地 址 中 标记 有 30 一 9 一 7=14 位 。 综 上 所 述 , 主 存 地 址 共有 以 下 三 个 
字段 : 高 14 位 为 标记 ,中 间 9 位 为 行 索引 , 低 7 位 为 块 内 地 址 。 

(2) 因为 直接 映射 不 考虑 替换 算法 ,所 以 cache 行 中 没有 用 于 替换 的 控制 位 ;因为 采用 
直 写 方式 ,所 以 ,cache 行 中 也 没有 修改 位 。 每 个 cache 行 中 包含 1 位 有 效 位 、14 位 标记 位 和 
128B 的 数据 ,因此 ,cache 总 容量 为 512X (1 十 14 十 128X8)==519. 5Kb。 

10. 对 于 数据 的 访问 ,分 别 给 出 具有 下 列 要 求 的 程序 或 程序 段 的 示例 。 

(1) 空间 局 部 性 和 时 间 局 部 性 都 好 。 

(2) 时 间 局 部 性 好 ,空间 局 部 性 差 。 

(3) 空间 局 部 性 好 ,时 间 局 部 性 差 。 

(4) 时 间 局 部 性 和 空间 局 部 性 都 差 。 

【分 析 解 答 】 

对 于 按 行 优先 存放 在 内 存 的 多 维 数组 ,如 果 按 列 优先 访问 数组 元 素 , 则 空间 局 部 性 就 
差 ; 如 果 在 一 个 循环 体 中 某 个 数组 元 素 只 被 访问 一 次 , 则 时 间 局 部 性 就 差 。 假 定 二 维 数组 
a[1000][1000] 按 行 优先 存放 在 内 存 ,以 下 给 出 的 4 个 程序 片段 用 于 对 数组 a 进行 相应 的 处 
理 ,它们 具有 相同 的 功能 ,但 数组 访问 的 时 间 局 部 性 和 空间 局 部 性 截然 不 同 ( 不 考虑 编译 器 
的 优化 ) 。 

(1) 时 间 局 部 性 和 空间 局 部 性 都 好 的 程序 片段 : 


for (i=0; i<1000; i++) 
for(j=0; j<1000; j++){ 
sum=sumta[i] [j]; 
product=product * a[i] [j]; 
square=squareta[i] [j] *al[il] [j]; 


} 
(2) 时 间 局 部 性 好 ,空间 局 部 性 差 的 程序 片段 : 


for(j=0; j<1000; j++) 
for (i=0; i<1000; i++){ 
sum=sum+al[i] [j]; 
product=product * a[i] [j]; 
square=squaret+a[i] [j] *a[il] [j]; 
# 


(3) 空间 局 部 性 好 ,时 间 局 部 性 差 的 程序 片段 : 


for(i=0; i<1000; i++) 
for (j=0; j<1000; j++) 
sum=sumtal[i] [j]; 
for (i=0; i<1000; i++) 
for(j=0; j<1000; j++) 
product=product * a[i] [j]; 
for(i=0; i<1000; i++) 
for(j=0; j<1000; j++) 
square=squareta[i] [j] *a[lil [ij]; 
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(4) 时 间 局 部 性 和 空间 局 部 性 都 差 的 程序 片段 : 


for(j=0; j<1000; j++) 
for(i=0; i<1000; i++){ 
sum=sum+al[il] [j]; 
for (j=0; j<1000; j++) 
for (i=0; i<1000; i++){ 
product=product * a[i] [j]; 
for(j=0; j<1000; j++) 
for (i=0; i<1000; i++){ 


square=squareta[i] [j] *al[i] [j]; 


11. 假定 某 计算 机 的 主 存 地 址 空间 大 小 为 64KB, 按 字 节 编 址 ;cache 采用 4 路 组 相 联 映 
射 LRU 替换 和 写 回 (write back) 策 略 ,能 存放 4KB 数据 , 主 存 与 cache 之 间 交 换 的 主 存 块 
的 大 小 为 64B。 请 回答 下 列 问 题 : 

(1) 主 存 地 址 字段 如 何 划分 ?要求 说 明 每 个 字段 的 含义 、 位 数 和 在 主 存 地 址 中 的 位 置 。 

(2) cache 的 总 容量 有 多 少 位 ? 

(3) 若 cache 初始 为 空 ,CPU 依次 从 0 号 地 址 单元 顺序 访问 到 4344 号 单元 , 共 重 复 访 
问 16 次 。cache 存 取 时 间 为 20ns, 主 存 存 取 时 间 为 200ns, 试 估计 CPU 访 存 的 平均 时 间 。 

【分 析 解 答 】 

(1) cache 的 行 数 为 4KB/64B= 64; 因 为 采用 4 路 组 相 联 ,所 以 每 组 4 行 , 共 16 组 。 
主 存 地 址 空间 大 小 为 64KB, 按 字 节 编 址 ,所 以 主 存 地 址 有 16 位 ,其 中 低 6 位 为 块 内 地 址 ,中 
间 4 位 为 组 号 (组 索引 ) ,高 6 位 为 标记 。 

(2) 因为 采用 写 回 策略 ,所 以 cache 每 行 中 要 有 一 个 修改 位 (dirty bit) ;因为 每 组 有 
4 行 ,所 以 每 行 有 两 位 LRU 位 。 此 外 ,每 行 还 有 6 位 标记 、1 位 有 效 位 和 64B 数据 ,共有 
64 行 , 故 总 容量 为 64X(6 十 1 十 1 十 2 十 64X8) 二 33408 位 。 

(3) 因为 块 大 小 为 64B,CPU 总 共 访 问 了 4345 个 单元 ,因为 4345/64s:67. 89, 所 以 第 
0 一 4344 单元 应 该 对 应 前 68 块 (第 0~67 块 ) ,也 即 CPU 访问 过 程 是 对 主 存 的 前 68 块 连续 
访问 16 次 。 图 7. 2 给 出 了 访问 过 程 中 主 存 块 和 cache 行 之 间 的 映射 关系 。 图 中 列 方向 是 
cache 的 16 个 组 , 行 方向 是 每 组 的 4 行 。 





第 0 行 第 1 行 第 2 行 第 3 行 
第 0 组 | 0/64/48 16/0/64 32/16 48/32 
第 组 | 1/65/49 17/1/65 33/17 49/33 
第 2 组 | 2/66/50 18/2/66 34/18 50/34 
第 3 组 | 3/67/51 19/3/67 35/19 51/35 
第 组 | 4 20 36 52 
第 1 组 | 15 31 47 63 





图 7.2 题 11 中 cache 组 和 主 存 块 之 间 的 映射 


主 存 的 第 0~15 块 分 别 对 应 cache 的 第 0~15 组 ,可 以 放 在 对 应 组 的 任意 一 行 中 ,在 此 


才 人 测 


计算 机 组 成 与 系统 结 攀 习题 解答 和 我 学 指 时 (第 2 版 ) 





假定 按 顺 序 存放 在 第 0 行 ; 主 存 的 第 16 一 31 抉 也 分 别 对 应 cache 的 第 0 一 15 组 , 放 到 第 
1 行 中 ; 同 理 , 主 存 的 第 32~47 块 分 别 放 到 cache 的 第 0~15 组 的 第 2 行 中 ; 主 存 的 第 48 一 
63 块 分 别 放 到 cache 的 第 0~15 组 的 第 3 行 中 。 这 样 ,访问 主 存 的 第 0 一 63 块 都 是 没有 冲 
突 的 ,每 块 都 是 第 一 次 在 cache 中 没有 找到 ,然后 把 这 一 块 调 到 cache 对 应 组 的 某 一 行 中 ,这 
样 该 块 后 面 的 每 次 访问 都 能 在 cache 中 找到 。 因 此 ,每 一 块 只 有 第 一 单元 未 命中 ,其 余 
63 个 单元 都 命中 。 主 存 的 第 64 一 67 块 分 别 对 应 cache 的 第 0~3 组 ,此 时 ,这 4 组 的 4 个 行 
都 已 经 被 主 存 块 占 满 , 所 以 这 4 组 的 每 一 组 都 要 选择 一 个 主 存 块 从 cache 中 淘汰 出 来 。 因 
为 采用 LRU 算法 ,所 以 ,将 最 近 最 少 用 的 第 0 一 3 块 分 别 从 第 0 一 3 组 的 第 0 行 中 替换 出 来 。 
再 把 第 64 一 67 块 分 别 放 到 cache 第 0 一 3 组 的 第 0 行 中 ,每 块 也 都 是 第 一 次 在 cache 中 没有 
找到 ,调和 人 后 ,每 次 都 能 在 cache 中 找到 。 

综 上 所 述 ,第 一 次 循环 中 ,每 一 块 都 只 有 第 一 单元 未 命中 ,其 余 都 命中 。 

以 后 的 15 次 循环 中 ,因为 cache 第 4~15 组 的 48 行 中 的 主 存 块 一 直 没 有 被 替换 过 ,所 
以 只 有 68 一 48 二 20 个 行 中 对 应 主 存 块 的 第 一 个 单元 未 命中 ,其 余 都 命中 。 

总 访问 次 数 为 4345X16 王 69520, 其 中 ,未 命中 次 数 为 68 十 15X20==368。 

命中 率 户 为 (69520 一 368)/69520 关 99. 47%。 平 均 访 存 时 间 约 为 二 = 大 十 (1 一 户 ) X 
如 一 20 十 200X(1 一 0.9947) 一 20 十 1.06 一 21.06ns。 

12. 假定 某 计 算 机 的 cache 采用 直接 映射 方式 ,和 主 存 交换 的 数据 块 大 小 为 1 个 字 , 按 
字 编 址 ,一 共 能 存放 16 个 字 的 数据 。CPU 开始 执行 某 程序 时 ,cache 为 空 ,在 该 程序 执行 过 
程 中 ,CPU 依次 访问 以 下 地 址 序列 : 2,3,11,16,21,13,64,48,19,11,3,22,4,27,6 和 11。 
请 回答 下 列 问题 。 

(1) 每 次 访问 在 cache 中 命中 还 是 缺失 ? 试 计算 访问 上 述 地 址 序列 的 cache 命中 率 。 

(2) 若 cache 数据 区 容量 还 是 16 个 字 , 而 数据 块 大 小 改 为 4 个 字 , 则 上 述 地 址 序列 的 命 
中 情况 又 如 何 ? 说 明 块 大 小 和 命中 率 的 关系 。 

【分 析 解 答 】 

(1) cache 采用 直接 映射 ,每 行 存放 一 个 字 , 因 此 共 16 行 ;每 个 主 存 块 对 应 1 个 字 , 所 以 
主 存 块 号 = 字号 。 得 到 映射 公式 为 cache 行 号 = 字号 mod 16。 程 序 开始 执行 时 cache 为 
空 , 所 以 每 个 单元 第 一 次 访问 总 是 缺失 (miss)。CPU 访问 给 定 地 址 序列 的 过 程 如 下 (每 个 
数字 对 x 一 y 的 含义 为 x 是 访问 的 主 存 地址 ,y 是 对 应 的 cache 行 号 。hit 表示 命中 ,miss 表 
示 缺 失 ,miss/replace 表示 缺失 并 替换 ); 2-2: miss;3-3: miss;11-11: miss;16-0: miss;21- 


5: miss; 13-13: miss; 64-0: miss/replace; 48-0: miss/replace; 19-3: miss/replace; 11-11: 














hit;3-3: miss/replace; 22-6: miss; 4-4: miss; 27-11: miss/replace; 6-6: miss/replace; 11- 
11: miss/replace。 只 有 一 次 命中 ,命中 率 为 1/16 一 6. 25%。 

(2) 数据 块 大 小 改 为 4 个 字 ,cache 最 多 能 存放 16 个 字 的 数据 ,因此 cache 共 4 行 ;每 个 
主 存 块 对 应 4 个 字 , 所 以 , 主 存 块 号 =[ 字 号 /4]。 得 到 映射 公式 为 : cache 行 号 = 主 存 块 号 
mod 4。CPU 访问 给 定 地 址 序列 的 过 程 如 下 (每 个 数字 序列 x-y-z 的 含义 为 “z 是 访问 的 主 
存 地 址 ,y 是 对 应 的 主 存 块 号 ,zx 是 对 应 的 cache 行 号 ”。hit 表示 命中 ,miss 表示 缺失 ,miss/ 
replace 表示 缺失 并 替换 ): 2-0-0: miss;3-0-0: hit; 11-2-2: miss; 16-4-0， miss/replace; 21-5-1; 
miss;13-3-3: miss; 64-16-0: miss/replace; 48-12-0: miss/replace; 19-4-0: miss/replace; 
11-2-2: hit; 3-0-0: miss/replace; 22-5-1: hit; 4-1-1: miss/replace; 27-6-2: miss/replace; 6-1-1: 
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hit;11-2-2: miss/replace。 共 命中 4 次 ,命中 率 为 4/16 二 25%。 数 据 块 变 大 后 ,命中 率 提高 
了 ,其 原因 在 于 块 变 大 后 空间 局 部 性 得 到 更 大 发 挥 。 

13. 假定 数组 元 素 在 主 存 按 从 左 到 右 的 下 标 顺序 存放 。 试 改变 下 列 函数 中 循环 的 顺 
序 ,使 得 其 数组 元 素 的 访问 与 排列 顺序 一 致 ,并 说 明 为 什么 修改 后 的 程序 比 原来 的 程序 执行 
时 间 短 。 


int sum array (int a[N] [N] [IN]) 
于 

int i, j, k, sum=0; 

for (i=0; i<N; i++) 

for(j=0; j<N; j++) 
for (k=0; k<N; k++) 
sumt=a[k] [i] [j]; 
return sum; 


} 


【分 析 解 答 】 
数组 元 素 的 访问 顺序 和 排列 顺序 一 致 的 程序 如 下 : 


int sum array (int a[N] [N] [N]) 
{ 

int i, j, k, sum=0; 

for (k=0; kK<N; k++) 

for (i=0; i<N; i++) 
for (j=0; j<N; j++) 
sumt+=a[k] [i] [j]; 
return sum; 


} 


当 被 访问 的 数组 元 素 不 在 cache 中 时 , 则 将 该 数组 元 素 所 在 的 一 个 主 存 块 全 部 装 入 
cache, 因 为 访问 顺序 和 排列 顺序 一 致 ,所 以 ,随后 访问 的 若干 个 数组 元 素 都 和 该 数组 元 素 在 
同一 个 主 存 块 中 ,因而 也 都 能 在 cache 中 命中 。 因 此 ,修改 后 的 程序 ,其 数组 访问 的 空间 局 
部 性 比 原 程序 更 好 ,命中 率 更 高 ,使 得 执行 时 间 更 短 。 

14. 某 计 算 机 的 主 存 地 址 空间 大 小 为 256MB, 按 字 节 编 址 。 指 令 cache 和 数据 cache 分 
离 , 均 有 8 个 cache 行 , 主 存 与 cache 交换 的 块 大 小 为 64B, 数 据 cache 采用 直接 映射 方式 。 
现 有 两 个 功能 相同 的 程序 A 和 也 ,其 伪 代 码 如 图 7.3 所 示 。 

假定 int 类 型 数据 用 32 位 补 码 表示 ,程序 编译 时 i\j、sum 均 分 配 在 寄存 器 中 ,数组 a 按 
行 优先 方式 存放 ,其 首 地 址 为 320( 十 进 制 数 )。 请 回答 下 列 问题 ,要 求 说 明理 由 或 给 出 计算 
过 程 。 

(1) 若 不 考虑 用 于 cache 一 致 性 维护 和 替换 算法 的 控制 位 , 则 数据 cache 的 总 容量 为 
多 少 ? 

(2) 数组 元 素 aL0][L31] 和 aLl1][1] 各 自 所 在 的 主 存 块 对 应 的 cache 行 号 分 别 是 多 少 
(cache 行 号 从 0 开始 )? 

(3) 程序 A 和 B 的 数据 访问 命中 率 各 是 多 少 ? 哪个 程序 的 执行 时 间 更 短 ? 
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程序 A: 程序 B: 
int a[256] [256]; int a[256] [256]; 
int sum arrayl ( ) int sum _ array2 ( ) 
{ { 
int i, j, sum = 0; int i, j, sum = 0; 
for (i= 0;i< 256; i++) for (j= 0;j < 256; j++) 
for (= 0; j < 256; j++) for (i=0;i< 256; i++) 
sum += a[li] [j]; sum += a[i] [j]; 
return sum; return sum; 
} 

















图 7.3 题 14 的 伪 代码 程序 


【分 析 解 答 】 

(1) cache 中 的 每 一 行 信息 除了 用 于 存放 主 存 块 的 数据 区 外 ,还 有 有 效 位 、 标 记 信息 ,以 
及 用 于 cache 一 致 性 维护 的 修改 位 (dirty bit) 和 用 于 替换 算法 的 使 用 位 (如 LRU 位 ) 等 控制 
位 。 因 为 主 存 地 址 空间 大 小 为 256MB, 因 而 主 存 地 址 为 28 位 ,其 中 6 位 为 块 内 地 址 ,3 位 为 
行 号 ( 行 索引 ) ,标志 信息 有 28 一 6 一 3 二 19 位 。 因 此 ,在 不 考虑 用 于 cache 一 致 性 维护 和 替 
换算 法 的 控制 位 的 情况 下 ,数据 cache 的 总 容量 为 8X (19 十 1 十 64X 8) 二 4256b 二 532B。 

(2) 解法 一 : 要 得 到 某 个 数组 元 素 所 在 块 对 应 的 cache 行 号 ,最 简单 的 做 法 就 是 把 该 数 
组 元 素 的 地 址 计算 出 来 ,然后 根据 地 址 求 出 主 存 块 号 ,最 后 用 主 存 块 号 除 以 8 取 余数 ( 即 主 
存 块 号 mod 8) 就 是 对 应 的 cache 行 号 。 因 为 每 个 数组 元 素 为 一 个 32 位 int 型 变量 , 故 占 
4 个 字 节 ,因此 ,a[0][31] 的 地 址 为 320 十 4X31==444,[444/64]==6( 取 整 ), 因 此 a[0][31] 
对 应 的 主 存 块 号 为 6。 因 为 6 mod 8=6, 所 以 对 应 的 cache 行 号 为 6。 

解法 二 : 也 可 以 将 地 址 转换 为 28 位 二 进 制 地 址 ,然后 取出 其 中 的 行 索引 (即行 号 ) 字 段 
的 值 ,得 到 对 应 行 号 。 将 地 址 444 转换 为 二 进 制 表 示 为 0000 0000 0000 0000 000 110 
111100, 中 间 3 位 110 为 行 号 ( 行 索引 ), 因 此 ,对 应 的 cache 行 号 为 6。 

解法 三 : 用 画图 的 方式 可 以 清楚 地 表示 cache 行 和 主 存 块 之 间 的 映射 关系 。( 略 ) 

同 理 , 数 组 元 素 a[1][1] 对 应 的 cache 行 号 为 [(320 十 4X(1X256 十 1))/64] mod 


(3) 编译 时 ij、sum 均 分 配 在 寄存 器 中 , 故 数据 访问 命中 率 仅 需要 考虑 数组 a 的 访问 
情况 。 

Q 程序 A 的 数据 访问 命中 率 。 

解法 一 : 由 于 程序 A 中 数组 访问 顺序 与 存放 顺序 相同 , 故 依次 访问 的 数组 元 素 位 于 相 
邻 单元 ;程序 共 访 问 256X256=64K 次 , 占 64KX4B/64B=4K 个 主 存 块 ;因为 首 地 址 正好 
位 于 一 个 主 存 块 的 边界 , 故 每 次 将 一 个 主 存 块 装 入 cache 时 ,总 是 第 一 个 数组 元 素 缺 失 , 其 
他 都 命中 , 共 缺 失 4K 次 ,因此 ,数据 访问 的 命中 率 为 (64K 一 4K)/64K==93.75%。 

解法 二 : 因为 每 个 主 存 块 的 命中 情况 都 一 样 ,因此 ,也 可 以 按 每 个 主 存 块 的 命中 率 计 
算 。 主 存 块 大 小 为 64B, 包 含 16 个 数组 元 素 ,因此 , 共 访 存 16 次 ,其 中 第 一 次 不 命中 ,所 以 
命中 率 为 15/16 二 93.75%。 

@ 程序 B 的 数据 访问 命中 率 。 

由 于 程序 B 中 的 数组 访问 顺序 与 存放 顺序 不 同 ,依次 访问 的 数组 元 素 分 布 在 相隔 
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256X4 二 1024 的 单元 处 ,因此 ,依次 访问 的 前 后 数组 元 素 都 不 在 同一 个 主 存 块 中 ;因为 数据 
cache 只 有 8 行 ,而 每 次 内 循环 要 调 人 256 X4/64B 二 16 个 主 存 块 ,因此 ,以 前 被 装 入 到 
cache 的 主 存 块 , 当 需 要 再 次 访问 其 中 的 数组 元 素 时 ,已 经 被 替换 出 cache, 因 而 不 能 命中 。 
由 此 可 知 ,所 有 访问 都 不 命中 ,命中 率 为 0。 
因为 程序 A 的 命中 率 高 ,因此 ,程序 A 的 执行 速度 比 程序 B 快 。 
15. 图 7.4 给 出 了 三 个 函数 ,分 析 比 较 它们 的 空间 局 部 性 ,并 指出 哪个 最 好 ,哪个 最 差 。 





# define N 1000 
typedef struct { 


void clearl (point *p, int n) 
{ 
int i, Jj; 
for (i=0;1i<n; i++) { 
for (j = 0; j<3; j++) 
p[il.vel[j] = 0; 
for (j = 0; j<3; j++)| 
p[il.acc[j] = 0; 





# define N 1000 
typedef struct { 


int vel[3]; int vel[l3]; 

int acc[3]; int acc[3]; 
} point; } point; 
point p[N]; point p[N]; 


void clear2 (point *p, int n) 
{ 
int i, j; 
for (i=0; i<n; i++) { 
for (j=0; j<3; j++) { 
p[il.vel[j] = 0; 
plil.acc[j] = 0; 








# define N 1000 
typedef struct { 
int vel[3]; 
int acc[3]; 
} point; 
point p[N]; 
void clear3(point *p, int n) 
{ 
int i, j; 
for (j=0; j<3; j++) { 
for (i=0; i<n; i++) 
p[il.vel[j] = 0; 
for (i=0; i<n; i++) 
p[il.acc[j] = 0; 








【分 析 解 答 】 


7.4 题 15 中 的 伪 代 码 程序 


对 于 函数 clearl ,其 数组 访问 顺序 与 在 内 存 的 存放 顺序 完全 一 致 ,因此 ,空间 局 部 性 


最 好 。 


对 于 函数 clear2 ,其 数组 访问 顺序 在 每 个 数组 元 素 内 跳 越 式 访问 , 相 邻 两 次 访问 的 单元 
最 大 相差 3 个 int 型 变量 (假定 sizeof(int)=4, 则 相当 于 12B) ,因此 空间 局 部 性 比 clearl 
差 。 若 主 存 块 大 小 比 12B 小 , 则 大 大 影响 命中 率 。 

对 于 函数 clear3 ,其 数组 访问 顺序 与 在 内 存 的 存放 顺序 不 一 致 , 相 邻 两 次 访问 的 单元 都 
相差 6 个 int 型 变量 (假定 sizeof(int)=4, 则 相当 于 24B) 因 此 ,空间 局 部 性 比 clear2 还 差 。 
若 主 存 块 大 小 比 24B 小 , 则 大 大 影响 命中 率 。 


16. 以 下 是 计算 两 个 向 量 点 


float dotproduct (float x 
float sum=0.0; 
int i; 


for (i=0; i<8; i++) 


点 积 的 程序 段 : 


[8], float y[8]) 


Sum +=x[i] * y[i]; 


return sum; 


} 
请 回答 下 列 问题 。 


(1) 访问 数组 x 和 y 时 的 时 间 局 部 性 和 空间 局 部 性 各 如 何 ? 你 能 否 推 断 出 命中 率 的 


高 低 ? 


第 
7 
章 





计算 机 组 成 与 系统 结 欧 习题 解答 和 我 学 指 时 (第 2 版 ) 





(2) 假定 数据 cache 采用 直接 映射 方式 ,数据 区 容量 为 32B, 每 个 主 存 块 大 小 为 16B; 编 
译 器 将 变量 sum 和 i 分 配 在 寄存 器 中 ,数组 x 存放 在 00000040H 开始 的 32B 的 连续 存储 区 
中 ,数组 y 则 紧 跟 在 x 后 进行 存放 。 该 程序 数据 访问 的 命中 率 是 多 少 ? 要 求 说 明 每 次 访问 
时 cache 的 命中 情况 。 

(3) 将 上 述 (2) 中 的 数据 cache 改 用 2 路 组 相 联 映射 方式 , 块 大 小 改 为 8B, 其 他 条 件 不 
变 , 则 该 程序 数据 访问 的 命中 率 是 多 少 ? 

(4) 在 上 述 (2) 中 条 件 不 变 的 情况 下 ,将 数组 x 定义 为 float[12], 则 数据 访问 的 命中 率 
是 多 少 ? 

【分 析 解 答 】 

(1) 数组 x 和 y 都 按 存放 顺序 访问 ,空间 局 部 性 都 较 好 ,但 每 个 数组 元 素 都 只 被 访问 一 
次 , 故 没 有 时 间 局 部 性 。 命 中 率 的 高 低 与 cache 容量 , 块 大 小 ,映射 方式 等 都 有 关 , 而 题 干 中 
没有 给 出 这 些 信 息 ,因此 无 法 推断 命中 率 的 高 低 。 

(2) cache 共有 32B/16B=2 行 ;4 个 数组 元 素 占 一 个 主 存 块 ;数组 x 的 8 个 元 素 ( 共 
32B) 分 别 存 放 在 主 存 40H 开始 的 32 个 单元 中 ,共有 2 个 主 存 块 ,其 中 x[0]~x[3] 在 第 
4 块 中 ,x[ 和 一 x[7] 在 第 5 块 中 ;数组 y 的 8 个 元 素 分 别 在 主 存 第 6 块 和 第 7 块 中 。 所 以 ， 
x[L0]~x[L3] 和 y[0]~y[3] 都 映射 到 cache 第 0 行 ;x[4]~~x[7] 和 y[4]~y[7] 都 映射 到 
cache 第 1 行 。 因为 x[ 让 和 y[ 让 总 是 映射 到 同一 个 cache 行 ,相互 淘汰 对 方 , 故 每 次 都 不 命 
中 ,命中 率 为 0。 

(3) 改 用 2 路 组 相 联 , 块 大 小 改 为 8B, 则 cache 共有 4 行 ,每 组 两 行 , 共 两 组 。 两 个 数组 
元 素 占 一 个 主 存 块 。 数 组 x 占 4 个 主 存 块 ,数组 元 素 x[0]~~x[1]、x[2]~~x[3j、x[4j~ 
x[5]、x[6] 一 x[7] 分 别 在 第 8~11 块 中 ;数组 y 占 4 个 主 存 块 ,数组 元 素 y[0]~y[1]、 
y[2j~~y[3],y[4]~~y[5]、y[6]~~y[7] 分 别 在 第 12~15 块 中 ;因为 每 组 有 两 行 ,所 以 x[ 订 和 
y[ 训 可 以 存放 到 同一 个 cache 组 的 不 同 cache 行内 ,因此 ,不 会 发 生 冲 突 。 每 调 入 一块 , 装 入 
的 2 个 数组 元 素 中 ,第 2 个 数组 元 素 总 是 命中 , 故 命中 率 为 50%。 

(4) 将 数组 x 定义 为 12 个 元 素 后 , 则 x 共有 48B, 使 得 y 从 主 存 第 7 抉 开始 存放 , 即 : 
x[L0] 一 x[L3] 在 第 4 块 中 ,x[4] 一 x[L7] 在 第 5 块 中 ,x[8]~xL11] 在 第 6 块 中 ,y[0]~y[3] 在 
第 7 块 中 ,yL4]~x[L7] 在 第 8 块 中 。 因 而 ,x[ 训 和 y[ 问 就 不 会 映射 到 同一 个 cache 行 中 。 每 
调和 一块, 装 入 4 个 数组 元 素 ,第 一 个 元 素 不 命中 ,后 面 3 个 总 命中 , 故 命中 率 为 75%。 

17. 以 下 是 对 矩阵 进行 转 置 的 程序 段 ; 


typedef int array[4] [4]; 
void transpose (array dst, array src) 
{ 
int i, j; 
for (i=0; i<4; i++) 
for(j=0; j<4; j++) 
dst[j] [il=src[i] [(j]; 


假设 该 段 程序 运行 的 计算 机 中 sizeof(int) 二 4, 且 只 有 一 级 cache, 其 中 Ll data cache 的 
数据 区 大 小 为 32B, 采 用 直接 映射 、 写 回 方式 , 块 大 小 为 16B, 初 始 为 空 。 数 组 dst 从 地 址 
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0000 C000H 开始 存放 ,数组 src 从 地 址 0000 C040H 开始 存放 。 仿 照 col=0,row=0 栏目 
中 的 形式 填写 表 7. 1 ,说 明 数组 元 素 srcLrowj][col] 和 dst[rowj[Lcol] 各 自 映射 到 cache 哪 一 
行 ,其 访问 是 命中 (hit) 还 是 缺失 (miss)。 若 L1 data cache 的 数据 区 容量 改 为 128B 时 ,重新 
填写 表 中 内 容 。 


表 7.1 题 17 中 的 src 数 组 和 dst 数组 





列 src 数组 dst 数 组 





A 


col=0 col=1 col=2 col=3 col=0 col=1 col=2 col=3 





row=0 | 0/miss 





row=1 





row=2 











row=3 

















【分 析 解 答 】 

从 程序 来 看 ,数组 访问 过 程 如 下 : 

src[0] [0 .dst[O] [OJ\srcLO] [1] .dst[1] [OJ,srcL0] [2]、dst[2] [0],src[0] [3]、 
dst[3] [0] 

src[1] [OJ ,dst[0] [1] src[1] [1]、dst[1] [1]、sre[1] [2]、dst[2] [1]、src[1] [3]、 
dst[3] [1] 

src[2] [0] .dstL0] [2j] ,src[2] [1].dst[1] [2],src[2] [2] .dst[2] [2]、src[2] [3]、 
CEE| 

src[3] [0] .dstL0] [3] ,src[3] [1] ,dst[L1] [3]、src[3] [2]、dst[2] [3] .srcL3] [3]、 
dst[3] [3J 

因为 块 大 小 为 16B, 每 个 数组 元 素 有 4B, 所 以 4 个 数组 元 素 占 一 个 主 存 块 ,因此 每 次 总 
是 调 入 4 个 数组 元 素 到 cache 的 一 行 中 。 

当 数 据 区 容量 为 32B 时 ,L1 data cache 中 共有 2 行 。 因 为 地 址 0000 C000H 和 0000 
C040H 的 最 低 5 位 都 是 0, 所 以 ,数组 元 素 dst[0J[i]、dst[2][ 记 ]、src[0j[]、src[2j[i] (i= 
0 一 3) 都 映射 到 cache 第 0 行 ,数组 元 素 dst[1][i] dst[3J[i]、src[1J[i]、src[3][i](=0~3) 
都 映射 到 cache 第 1 行 。 因 此 ,从 上 述 访问 过 程 来 看 ,srcL0][0] 所 在 的 主 存 块 ( 即 存放 src 
[0j[G=0~3) 中 四 个 数组 元 素 的 主 存 块 ) 刚 调 入 cache,dstL0]L0] 所 在 主 存 块 又 把 它 蔡 换 
掉 了 。 

当 数 据 区 容量 为 128B 时 ,L1 data cache 中 共有 8 行 。 数 组 元 素 dst[0j][i]、dst[1j[i、 
dst[2][i]、dst[3j[]、src[0J[]、src[1][ 订 src[2]j[i]、src[3][i] (i 二 0~3) 分 别 映射 到 cache 
第 0.1.2.3.4.5.6.7 行 。 因 此 ,不 会 发 生 数组 元 素 的 替换 。 每 次 总 是 第 一 个 数组 元 素 不 命 
中 ,后 面 三 个 数组 元 素 都 命中 。 

表 7.2 和 表 7.3 给 出 了 cache 数据 区 容量 分 别 为 32B 和 128B 时 数组 src 和 dst 的 每 个 
元 素 的 命中 情况 。 








第 
7 
章 





计算 机 组 成 与 系统 结 欧 习题 解答 和 我 学 指 时 (第 2 版 ) 





表 7.2 题 17 中 的 src 数组 和 dst 数组 在 cache 数据 区 容量 为 32B 时 的 命中 情况 



































列 src 数 组 dst 数 组 
行 col=0 col=1 col=2 col=3 col=0 col=1 col=2 col=3 
row=0 0/miss 0/miss 0/hit 0/miss 0/miss 0/miss 0/miss 0/miss 
row=1 l/miss 1/hit l/miss 1/hit l/miss l/miss l/miss l/miss 
row=2 0/miss 0/miss 0/hit 0/miss 0/miss 0/miss 0/miss 0/miss 
row=3 l/miss 1/hit l/miss 1/hit 1/miss 1/miss 1/miss l/miss 

表 7.3 题 17 中 的 sre 数组 和 dst 数组 在 cache 数据 区 容量 为 128B 时 的 命中 情况 

列 src 数 组 dst 数组 
本 col=0 col=1 col=2 col=3 col=0 col=1 col=2 col=3 
row=0 | 4/miss 4/hit 4/hit 4/hit 0/miss 0/hit 0/hit 0/hit 
row=1 5/miss 5/hit 5/hit 5/hit l/miss 1/hit 1/hit 1/hit 
row=2 | 6/miss 6/hit 6/hit 6/hit 2/miss 2/hit 2/hit 2/hit 
row=3 | 7/miss 7/hit 7/hit 7/hit 3/miss 3/hit 3/hit 3/hit 





























18. 通过 对 方 格 中 每 个 点 


设置 相应 的 CMYK 值 就 可 以 将 方 格 涂 上 相应 的 颜色 。 图 7.5 


所 示 的 三 个 程序 段 都 可 实现 对 一 个 8X8 的 方 格 中 涂 上 黄 颜 色 的 功能 。 


int c; 
int m; 
int y; 
int k; 
} 





struct pt _color { 


int 


Struct pt_color square[8] [8]; |struct pt 








struct pt _color { 
int c; 
int m; 

int y; 


_Color quare[8] [8]; 





struct pt _color { 
int ce; 
int m; 
int y; 
int k; 


struct pt_color square[8] [8]; 





int i, j; int i, j; int 1 j» 
for (i= 0; i< 8; i++) { for (i= 0; i< 8; i+t+) { for (i= 0; i < 8; i++) 
for (] = 0;j < 8; j++) { for (]j = 0; j < 8; j++) {| for (j = 0; < 8; j++) 
square[i][j].c = 0; square [j] [il.c = 0; square[i][j].y= 1; 
square[i] [j].m = 0; square [j] [i]j.m = 0; |for (i = 0; i < 8; i++) 
square[i] [j].y ; square [j] [il.y = 1; for (j= 0; j < 8; j++) { 
square[i][j].k = 0; square [j] [il].k = 0; square[i][j].c= 0; 
} } square[i][j] .m= 0; 
} } square[i][j].k = 0; 
} 
(a) 程序 段 A (b) 程序 段 B (9) 程序 段 C 


7.5 题 18 中 的 伪 代码 程序 


假设 cache 的 数据 区 大 小 为 512B, 采 用 直接 映射 , 块 大 小 为 32B, 存 储 器 按 字 节 编 址 ， 
sizeof(int) 二 4。 编 译 时 变量 i 和 j 分 配 在 寄存 器 中 ,数组 square 按 行 优先 方式 存放 在 
00000C80H 开始 的 连续 区 域 中 , 主 存 地 址 为 32 位 。 要 求 : 
(1) 对 三 个 程序 段 A、B、C 中 数组 访问 的 时 间 局 部 性 和 空间 局 部 性 进行 分 析 比 较 。 
(2) 画 出 主 存 中 的 数组 元 素 和 cache 中 行 的 对 应 关系 图 。 
(3) 计算 三 个 程序 段 A.B、C 中 数组 访问 的 写 操作 次 数 . 写 不 命中 次 数 和 写 缺 失 率 。 
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【分 析 解 答 】 

(1) 程序 段 A、B 和 C 中 ,都 是 每 个 数组 元 素 只 被 访问 一 次 ,所 以 都 没有 时 间 局 部 性 ; 程 
序 段 A 访问 顺序 和 存放 顺序 一 致 ,所 以 ,空间 局 部 性 好 ;程序 段 B 访 问 顺序 和 存放 顺序 不 一 
致 ,所 以 ,空间 局 部 性 不 好 ;程序 段 C 的 访问 顺序 和 存放 顺序 部 分 一 致 ,所 以 空间 局 部 性 的 
优 劣 介 于 程序 A 和 B 之 间 。 

(2) cache 的 行 数 为 512B/32B 王 16;square 数组 首 地 址 为 00000C80H 王 0…01100100 
00000B, 因 为 最 低 5 位 地 址 为 全 0, 说 明 square 数组 正好 是 主 存 第 1100100B(100) 块 的 起 始 
地 址 。 所 以 数组 从 主 存 第 100 块 开始 存放 ,一 个 数组 元 素 占 4X4B 王 16B, 所 以 每 2 个 数组 
元 素 占 用 一 个 主 存 块 。8X8 的 数组 共 占 用 32 个 主 存 块 ,正好 是 cache 数据 区 大 小 的 2 倍 。 
因为 100 mod 16==4, 所 以 主 存 第 100 块 映射 到 的 cache 行 号 为 4。 主 存 中 的 数组 元 素 与 
cache 行 的 映射 关系 如 图 7.6 所 示 。 


cache 行 号 主 存 块 号 
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[OJ] | 100# 
Square[0][2]/ [0][3] | 101# 


square[0][0] 

2 
square[0][4]/ [OJ[5] | 102# 
| 

ol 
























square[0][6]/ [0][7] | 103# 


/DID | 104# 








square[] 














112# 
113# 
square[3][4]/ [3][5] | 114# 









square[3 


square[3 

















Square[7][0] [7][1] | 128# 
129# 
130# 
square[7][6]/ [7][7] | 131# 


图 7.6 主 存 中 数组 元 素 与 cache 行 的 映射 关系 
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(3) 对 于 程序 段 A: 每 两 个 数组 元 素 ( 共 涉及 8 次 写 操作 ) 装 入 到 一 个 cache 行 中 ,总 是 
第 一 次 访问 时 未 命中 ,后 面 7 次 都 命中 ,所 以 ,总 的 写 操作 次 数 为 64X4=256 次 , 写 不 命中 
次 数 为 256X1/8 二 32 次 ,因而 写 缺 失 率 为 12. 5%。 

对 于 程序 段 B: 每 两 个 数组 元 素 ( 共 涉及 8 次 写 操作 ) 装 人 到 一 个 cache 行 中 ,但 总 是 只 
有 一 个 数组 元 素 (涉及 4 次 写 操作 ) 在 被 淘汰 之 前 被 访问 ,并 且 总 是 第 一 次 不 命中 ,后 面 3 次 
都 命中 。 即 写 不 命中 次 数 为 256X1/4=64 次 ,因而 写 缺 失 率 为 25% 。 

对 于 程序 段 C: 第 一 个 循环 共 访问 64 次 ,每 次 装 和 人 两 个 数组 元 素 , 第 一 次 不 命中 ,第 二 
次 命中 ;第 二 个 循环 , 共 访问 64X3 次 ,每 两 个 数组 元 素 ( 共 涉 及 6 次 写 操作 ) 装 人 到 一 个 
cache 行 中 ,并 且 总 是 第 一 次 不 命中 ,后 面 5 次 都 命中 。 所 以 总 的 写 不 命中 次 数 为 32 十 (3X 
64)X1/6 二 64 次 ,因而 总 的 写 缺失 率 为 25%。 

19. 已 知 cachel 采用 直接 映射 方式 , 共 16 行 , 块 大 小 为 1 个 字 , 缺 失 损 失 为 8 个 时 钟 周 
期 ;cache2 也 采用 直接 映射 方式 , 共 4 行 , 块 大 小 为 4 个 字 , 缺 失 损失 为 11 个 时 钟 周期 。 假 
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定 开始 时 cache 为 空 ,采用 字 编 址 方式 。 要 求 找 出 一 个 访问 地 址 序列 ,使 得 cache2 具有 更 低 
的 缺失 率 ,但 总 的 缺失 损失 反而 比 cachel 大 。 

【分 析 解 答 】 

假设 cachel 和 cache2 的 缺失 次 数 分 别 为 x 和 y ,根据 题 意 ,x 和 y 必须 满足 以 下 条 件 ， 
11y>8z 且 x 之 y, 显 然 ,满足 该 条 件 的 x 和 y 有 许多 ,例如 ,z=4,y=3 或 zx=5,y=4 等 。 

对 于 以 下 的 访问 地 址 序列 : 0,1,4,8,cachel 缺失 4 次 ,而 cache2 缺失 3 次 。 

对 于 以 下 的 访问 地 址 序列 : 0,2,4,8,12,cachel 缺失 5 次 ,而 cache2 缺失 4 次 。 

对 于 以 下 的 访问 地 址 序列 , 0,3,4,8,12,16,20,cachel 缺失 7 次 ,而 cache2 缺失 6 次 。 

如 此 等 等 ,可 以 找 出 很 多 。 

20. 提高 关联 度 通常 会 降低 缺失 率 ,但 并 不 总 是 这 样 。 请 给 出 一 个 地 址 访问 序列 ,使 得 
采用 LRU 替换 算法 的 2 路 组 相 联 映射 cache 比 具 有 同样 大 小 的 直接 映射 cache 的 缺失 率 
更 高 。 

【分 析 解 答 】 

2 路 组 相 联 cache 的 组 数 是 直接 映射 cache 的 行 数 的 一 半 , 所 以 ,可 以 找到 一 个 地 址 序 
列 A.B.C, 使 得 A 映射 到 某 一 个 cache 行 ,B 和 C 同时 映射 到 另 一 个 cache 行 ,并 有 A、B、C 
映射 到 同一 个 cache 组 。 这 样 ,如 果 访 存 的 地 址 序列 为 A、B.C、A、B、C、A、B.C、…, 则 对 于 
直接 映射 cache, 其 命中 情况 为 miss/miss/miss/hit/miss/miss/hit/miss/miss/… 命 中 率 可 
达 33.3%; 对 于 组 相 联 cache, 因 为 A、B、C 映射 到 同一 个 组 ,每 组 只 有 2 行 ,采用 LRU 替换 
算法 ,所 以 ,每 个 地 址 处 的 数据 刚 调 出 cache 就 又 被 访问 到 ,每 次 都 是 miss, 命 中 率 为 0。 例 
如 ,假定 直接 映射 cache 为 4 行 X1 字 / 行 ,同样 大 小 的 2 路 组 相 联 cache 为 2 组 X2 行 /组 Xx 
1 字 / 行 , 当 访问 序列 为 0.2.4.0.2.4.0.2.4…( 局 部 块 大 小 为 3, 大 于 每 一 组 的 行 数 ) 时 , 则 
出 现 上 述 情况 。 

当 访问 的 局 部 块 比 组 大 时 ,可 能 会 发 生 * 颠 艇 (抖动 )? 现 象 : 刚 被 替换 出 去 的 数据 又 被 
访问 ,导致 缺失 率 为 100%! 

21. 假定 有 3 个 处 理 器 ,分 别 带 有 以 下 不 同 的 cache。 

cachel: 采用 直接 映射 方式 , 块 大 小 为 1 个 字 , 指 令 和 数据 的 缺失 率 分 别 为 4% 和 6%。 

cache2: 采用 直接 映射 方式 , 块 大 小 为 4 个 字 , 指 令 和 数据 的 缺失 率 分 别 为 2% 和 4%。 

cache3: 采用 2 路 组 相 联 映射 方式 , 块 大 小 为 4 个 字 , 指 令 和 数据 的 缺失 率 分 别 为 2% 
和 3%。 

在 这 些 处 理 器 上 运行 相同 的 程序 ,该 程 序 的 CPI 为 2. 0, 其 中 有 一 半 是 访 存 指令 。 若 缺 
失 损 失 为 “ 块 大 小 十 6” 个 时 钟 周期 ,处 理 器 1 和 处 理 器 2 的 时 钟 周期 都 为 420ps, 带 有 
cache3 的 处 理 器 3 的 时 钟 周期 为 450ps。 请 问 : 哪个 处 理 器 因 cache 缺失 而 引起 的 额外 开 
销 最 大 ? 哪个 处 理 器 执行 速度 最 快 ? 

【分 析 解 答 】 

假设 所 运行 的 程序 共 执 行 N 条 指令 ,每 条 访 存 指令 仅 读 写 一 次 内 存 数 据 , 则 在 该 程序 
执行 过 程 中 各 处 理 器 因 cache 缺失 而 引起 的 额外 开销 和 执行 时 间 计 算 如 下 。 

对 于 处 理 器 1, 额 外 开销 为 NX(4% 十 6%X50%)X(1 十 6) 二 0.49N 个 时 钟 周期 ,执行 
程序 所 需 时 间 为 (NX2.0 十 0. 49N) X420 二 1045. 8N( 单 位 为 ps) 。 

对 于 处 理 器 2, 人 额外 开销 为 NX(2% 十 4%X50%)X (4 十 6) 二 0.4N 个 时 钟 周期 ,执行 
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程序 所 需 时 间 为 (NX2.0 十 0. 4N) X420 二 1008N( 单 位 为 ps) 。 

对 于 处 理 器 3, 额 外 开销 为 NX(2% 十 3%X50%)X(4 十 6)==0.35N 个 时 钟 周期 ,执行 
程序 所 需 时 间 为 (NX2.0 十 0. 35N) X450==1057.5N( 单 位 为 ps) 。 

由 此 可 见 ,处 理 器 1 的 cache 缺失 引起 的 额外 开销 最 大 ,处 理 器 2 的 执行 速度 最 快 。 

22. 假定 某 处 理 器 带 有 一 个 数据 区 容量 为 256B 的 cache, 主 存 块 大 小 为 32B。 以 下 C 
语言 程序 段 运行 在 该 处 理 器 上 ,sizeof(int) 二 4, 编 译 器 将 变量 ij、c、s 都 分 配 在 通用 寄存 器 
中 ,因此 ,只 要 考虑 数组 元 素 的 访 存 情况 ,假定 数组 起 始 地 址 正好 在 一 个 主 存 块 的 开始 处 。 
车 cache 采用 直接 映射 方式 , 则 当 s=64 和 s=63 时 ,缺失 率 分 别 为 多 少 ? 若 cache 采用 2 
路 组 相 联 映射 方式 , 则 当 s=64 和 s=63 时 ,缺失 率 又 分 别 为 多 少 ? 


第 
2 
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int iv j，cv s, a[128]7 


for (i=0; i<10000; i++) 
for(j=0; j<128; j=j+s) 
c=a[j]; 

【分 析 解 答 】 

因为 块 大 小 为 32B, 数 组 起 始 地 址 正好 是 一 个 主 存 块 的 开始 ,所 以 每 8 个 数组 元 素 占 一 
个 主 存 块 ;cache 共有 256B/32B=8 行 ,在 2 路 组 相 联 映射 时 ,cache 有 4 组 。 以 下 仅 考 虑 数 
组 访问 情况 。 

(1) 直接 映射 ,s=64: 访 存 顺序 为 a[0]、a[64];a[0]、a[64];…, 共 循环 10 000 次 。 因 
为 aL0] 和 a[64] 正好 相差 256B, 即 相差 8 个 主 存 块 ,因而 除 8 同 余 , 直 接 映 射 方式 下 ,a[0] 
所 在 主 存 块 和 a[64] 所 在 主 存 块 正好 被 映射 到 同一 个 cache 行 ,因而 每 次 都 会 发 生 冲 突 ,其 
缺失 率 为 100%。 

(2) 直 接 映射 ,s 二 63: 访 存 顺序 为 a[0]、a[63]、a[126];a[0]、a[63]、a[126];… ,循环 
10 000 次 。 因 为 a[63] 所 在 主 存 块 的 第 一 个 数组 元 素 aL56] 和 aL126] 所 在 主 存 块 的 第 一 个 
数组 元 素 aL120] 之 间 正好 相差 256B, 即 相差 8 个 主 存 块 ,因而 除 8 同 余 , 直 接 映射 方式 下 ， 
这 两 个 元 素 正好 都 映射 到 同一 个 cache 行 ,因此 每 次 都 会 发 生 冲 突 ,而 a[0] 不 会 发 生 冲 突 ， 
故 缺 失 率 约 为 67%。 

(3) 2 路 组 相 联 ,s 一 64: 访 存 顺序 为 aL0]、aL64];a[L0]、aL64];…, 共 循环 10 000 次 。 因 
为 aL0] 和 a[64] 之 间 正 好 相差 256B, 即 相差 8 个 主 存 块 ,因而 除 4 同 余 , 在 2 路 组 相 联 映射 
方式 下 ,这 两 个 元 素 所 在 主 存 块 会 映射 到 同一 个 组 ,可 放 在 同一 组 的 不 同 cache 行 中 ,所 以 
不 会 发 生 冲 突 , 总 缺失 次 数 仅 为 2 次 ,缺失 率 近 似 为 0。 

(4) 2 路 组 相 联 ,s=63: 访 存 顺 序 为 a[0]、a[63]、a[126];a[0]、aL63]、a[126];…, 共 循 
环 10 000 次 。 因 为 a[63] 所 在 主 存 块 的 第 一 个 数组 元 素 a[56] 和 a[126] 所 在 主 存 块 的 第 一 
个 数组 元 素 aL120] 之 间 正 好 相差 256B, 即 相差 8 个 主 存 块 ,因而 除 4 同 余 ,这 两 个 元 素 所 在 
主 存 块 被 映射 到 同一 个 组 ,可 放 在 同一 组 的 不 同 cache 行 中 , 而 aL0] 不 会 发 生 冲 突 , 所 以 总 
缺失 次 数 仅 为 3 次 ,缺失 率 近 似 为 0。 

23. 假定 一 个 分 页 虚拟 存储 系统 的 虚拟 地 址 为 40 位 ,物理 地 址 为 36 位 ,页 大 小 为 
16KB, 按 字 节 编 址 。 若 页 表 中 有 有 效 位 、 存 储 保护 位 、 修 改 位 、 使 用 位 , 共 占 4 位 ,磁盘 地 址 
不 在 页 表 中 , 则 该 存储 系统 中 每 个 进程 的 页 表 大 小 为 多 少 ? 如 果 按 计算 出 来 的 实际 大 小 构 
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建 页 表 , 则 会 出 现 什 么 问题 ? 

【分 析 解 答 】 

因为 每 页 大 小 有 16KB, 所 以 虚拟 页 数 为 221(16X22) 一 20 1 一 23 页 。 物 理 页 面 和 虚 
拟 页 面 大 小 相等 ,所 以 物理 页 号 的 位 数 为 36 一 14 二 22 位 。 每 个 页 表 项 包括 有 效 位 ,保护 位 、 
修改 位 、 使 用 位 ,物理 页 号 等 ,所 以 其 位 数 至 少 为 4 十 22 二 26。 为 了 简化 对 页 表 项 的 访问 ,每 
个 页 表 项 取 32 位 。 因 此 ,每 个 进程 的 页 表 大 小 为 2*X 32/(8X2”) 二 256MB。 如 果 按 实际 
计算 出 的 页 表 大 小 构建 页 表 , 则 构建 出 的 页 表 会 因为 过 大 而 导致 页 表 无 法 一 次 装 人 内 存 。 

24. 假定 一 个 分 页 虚拟 存储 系统 按 字 节 编 址 ,逻辑 地 址 有 36 位 ,页 大 小 为 16KB, 物 理 
地 址 位 数 为 32 位 ,页 表 中 有 效 位 和 修改 位 各 占 1 位 、 使 用 位 和 存 取 方 式 位 各 占 2 位 ,而 且 所 
有 虚拟 页 都 在 使 用 中 。 请 问 : 每 个 进程 的 页 表 大 小 至 少 为 多 少 ? 如 果 所 使 用 的 快 表 (TLB) 
中 总 的 表 项 数 为 256 项 ,采用 2 路 组 相 联 cache 实现 , 则 快 表 的 大 小 至 少 为 多 少 ? 

【分 析 解 答 】 

因为 页 大 小 为 16KB, 所 以 页 内 地 址 位 数 为 14 位 。 逮 辑 地 址 为 36 位 , 虚 页 号 位 数 为 
36 一 14 一 22 ,虚拟 页 数 为 22 个 ,因此 每 个 进程 的 页 表 项 数 为 2* 个 。 物 理 地 址 为 32 位 , 实 页 
号 位 数 为 32 一 14=18。 每 个 页 表 项 的 位 数 为 1 十 1 十 2 十 2 十 18=24 位 。 每 个 进程 的 页 表 大 
小 至 少 为 24X22 /1(8X22) 王 12MB。 

TLB 中 总 的 表 项 数 为 256 项 ,采用 2 路 组 相 联 , 所 以 共有 128 组 。 虚 拟 页 号 22 位 中 ， 
低 7 位 用 来 表示 组 号 ,高 15 位 用 来 作为 标记 ,和 每 个 TLB 组 中 的 各 标记 进行 比较 ,以 判断 
是 否 TLB 命中 。 所 以 ,TLB 中 每 个 页 表 项 的 位 数 比 主 存 中 页 表 项 的 位 数 多 了 15 位 的 标 
记 , 即 TLB 中 每 个 页 表 项 的 位 数 为 24 十 15=39 位 。 整 个 快 表 的 大 小 至 少 为 256 X 39= 
9984b, 即 1248B。 

25. 假定 一 个 计算 机 系统 中 有 一 个 TLB 和 一 个 L1 data cache。 该 系统 按 字 节 编 址 , 虚 
拟 地 址 16 位 ,物理 地 址 12 位 ;页 大 小 为 128B,TLB 为 4 路 组 相 联 ,共有 16 个 页 表 项 ;L1 
data cache 采用 直接 映射 方式 , 块 大 小 为 4B, 共 16 行 。 在 系统 运行 到 某 一 时 刻 时 ,TLB、 页 
表 和 Ll data cache 中 的 部 分 内 容 ( 用 十 六 进 制 表示 ) 如 图 7.7 所 示 。 

请 回答 下 列 问题 

(1) 虚拟 地 址 中 哪 几 位 表示 虚拟 页 号 ?哪儿 位 表示 页 内 偏 移 量 ? 虚拟 页 号 中 哪 几 位 表 
示 TLB 标记? 哪 几 位 表示 TLB 索引? 

(2) 物理 地 址 中 哪 几 位 表示 物理 页 号 ? 哪 几 位 表示 页 内 偏 移 量 ? 主 存 物理 地 址 如 何 划 
分 成 标记 字段 . 行 索引 字段 和 块 内 地 址 字段 ? 

(3) CPU 从 地 址 067AH 中 取出 的 值 为 多 少 ? 说 明 CPU 读 取 地 址 067AH 中 内 容 的 
过 程 。 

【分 析 解 答 】 

(1) 16 位 虚拟 地 址 中 低 7 位 为 页 内 偏 移 量 , 高 9 位 为 虚 页 号 ; 虚 页 号 中 高 7 位 为 TLB 
标记 , 低 2 位 为 TLB 组 索引 。 

(2) 12 位 物理 地 址 中 低 7 位 为 页 内 偏 移 量 ,高 5 位 为 物理 页 号 ;12 位 物理 地 址 中 , 低 2 
位 为 块 内 地 址 ,中间 4 位 为 cache 行 索引 ,高 6 位 为 标记 。 

(3) 地 址 067AH=0000 0110 0111 1010B, 所 以 , 虚 页 号 为 000001100B, 映 射 到 TLB 的 
第 0 组 ,将 0000011B=03H 与 TLB 第 0 组 的 4 个 标记 比较 ,虽然 和 其 中 一 个 相等 ,但 对 应 
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第 
组 号 标记 页 框 号 有 效 位 ”标记 页 框 号 有 效 位 ”标记 ”页 框 号 有 效 位 ”标记 ”页 框 号 有 效 位 pt 
0| 03 0 09 1D 1 一 0 07 10 1 章 
1| 13 2D 1 02 一 0 04 四 0 0A 本 0 
2| 02 加 0 08 一 0 06 四 0 03 一 0 
3 | 07 - 0 63 12 1 0A 34 1 72 国 0 
(a) TLB(4 路 组 相 联 ): 4 组 ，16 个 页 表 项 
虚 页 号 ”页 框 号 ”有 效 位 行 索引 ”标记 有 效 位 。 字 节 3 字 节 2 ” 字 节 1 ” 字 节 0 
000| 08 1 0 19 1 12 56 C9 AC 
001 03 1 1 本 0 a 本 四 本 
002 14 2 1B 1 03 45 12 CD 
003 02 1 3 一 0 二 和 一 一 
004 - 0 4| 32 1 23 34 @ 2A 
005 16 1 5| oD 1 46 67 23 3D 
006 全 0 6 0 - 国 
007| 07 l 7 10 1 12 54 65 DC 
008 13 1 8| 24 1 23 62 12 3A 
009 17 1 9 = 0 一 = 二 
00A | 09 A| 2D 1 43 62 23 C3 
00B 三 0 B - 0 - - 一 
00C 19 1 C 12 1 76 83 21 35 
00D - 0 D 16 1 A3 F4 23 11 
00E 11 1 E| 33 1 2D 4A 45 55 
OOF | oD 1 F - 0 - - - 
(b) 部 分 页 表 : (开始 16 项 ) (c) L1 data cache : 直接 映射 ， 共 16 行 ， 块 大 小 为 4B 


7.7 题 25 中 的 TLB、 页 表 和 cache 部 分 内 容 


的 有 效 位 为 0, 其 余 都 不 等 ,所 以 TLB 缺失 ,需要 访问 主 存 中 的 慢 表 。 直 接 查 看 000001100B= 
00CH 处 的 页 表 项 ,有 效 位 为 1, 取出 物理 页 号 19H=11001B, 和 页 内 偏 移 1111010B 拼接 成 
物理 地 址 110011 1110 10B。 根 据 中 间 4 位 1110 直接 找到 cache 第 14 行 ( 即 第 下 行 ), 其 有 
效 位 为 1, 且 标记 为 33H=110011B, 正 好 等 于 物理 地 址 高 6 位 , 故 cache 命中 。 最 后 根据 物 
理 地 址 最 低 两 位 10 ,取出 字 节 2 中 的 内 容 4AH=01001010B。 

26. 在 MIPS 架构 的 多 周期 CPU 中 ,TLB 缺失 和 cache 缺失 各 在 哪个 指令 的 哪个 时 
钟 周期 被 检测 到 ? 如 果 检 测 到 发 生 了 TLB 缺失 和 cache 缺失 ,那么 ,CPU 要 完成 哪些 工 
作 ? 简要 说 明 CPU 如 何 完 成 这 些 工作 ? (提示 : TLB 缺失 可 以 有 软件 和 硬件 两 种 处 理 
方式 。) 

【分 析 解 答 】 

TLB 缺失 和 cache 缺失 都 是 在 存储 访问 过 程 中 发 生 的 ,因而 这 两 种 缺失 在 相同 的 周期 
内 进行 检测 。 与 存储 访问 相关 的 周期 有 每 个 指令 的 取 指令 (IF) 周 期 .lw 指令 和 sw 指令 的 
存储 器 访问 (Mem) 周 期 。 

对 于 TLB 缺失 ,可 以 有 硬件 和 软件 两 种 处 理 方式 ,如 果 是 硬件 处 理 TLB 缺失 , 则 在 


计算 机 组 成 与 系统 结 药 习题 解答 和 我 学 指 时 (第 2 版 ) 





CPU 中 有 专门 处 理 TLB 缺失 的 逻辑 部 件 , 能 够 启动 一 次 存储 器 读 操作 ,到 主 存 读 取 相应 的 
页 表 项 内 容 装 入 TLB; 如 果 是 软件 处 理 TLB, 则 在 CPU 检测 到 发 生 了 TLB 缺失 的 情况 下 ， 
就 发 出 TLB 缺失 异常 , 调 出 操作 系统 内 核 中 专门 的 异常 处 理 程序 进行 处 理 。 

对 于 cache 缺失 , 则 通常 采用 硬件 处 理 方式 ,CPU 中 必须 提供 cache 缺失 处 理 多 辑 。 当 
CPU 检测 到 cache 缺失 时 ,由 硬件 自动 启动 存储 器 读 操作 , 读 取 一 个 主 存 块 到 cache。 
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8.1 教学 目标 和 内 容 安排 


主要 教学 目标 : 使 学 生 了 解 现代 计算 机 中 各 主要 模块 之 间 的 总 线 互 连 方式 ,以 及 输入 
输出 系统 涉及 的 软 硬 件 概念 和 知识 体系 ,为 操作 系统 的 学 习 打下 坚实 基础 。 本 章 主 要 内 容 
包括 ; 输入 输出 系统 的 组 成 .I/O 对 系统 性 能 的 影响 .1/O 〇 设备 的 种 类 和 特性 、 磁 盘存 储 器 的 
主要 性 能 指标 ,总线 基本 概念 及 系统 互 连 、I/O 接口 的 职能 和 分 类 、I/O 设备 和 主机 的 连接 
方式 ,程序 查询 I/O 方式 .中断 I/O 方式 和 DMA 方式 等 。 

基本 学 习 要 求 ， 

(1) 了 解 常用 外 部 设备 的 基本 原理 。 

(2) 了 解 磁盘 存储 器 的 主要 技术 指标 。 

(3) 了 解 磁盘 存储 器 的 记录 格式 。 

(4) 了 解 完 余 磁盘 阵列 (RAID) 的 基本 原理 。 

(5) 了 解 总 线 的 作用 和 组 成 。 

(6) 了 解 总 线 的 不 同 分 类 。 

(7) 理解 总 线 各 项 性 能 指标 的 含义 。 

(8) 理解 计算 机 如 何 通过 总 线 连接 各 功能 部 件 。 

(9) 了 解 I/O 接口 的 功能 和 基本 结构 。 

(10) 理解 I/O 接口 和 I/O 端口 的 差别 。 

(11) 了 解 各 种 I/O 接口 类 型 的 特点 。 

(12) 理解 I/O 端口 的 编 址 方式 。 

(13) 了 解 各 种 I/O 传送 控制 方式 的 特点 和 适用 场合 。 

(14) 了 解 程序 直接 控制 (查询 ) 方 式 的 特点 和 工作 流程 。 

(15) 了 解 中 断 I/O 方式 的 特点 和 工作 过 程 。 

(16) 理解 外 设 发 生 什么 事件 可 以 向 CPU 提出 中 断 请 求 。 

(17) 理解 CPU 响应 中 断 的 3 个 条 件 。 

(18) 理解 CPU 响应 中 断 请 求 的 过 程 。 

(19) 掌握 调 出 中 断 服务 程序 的 方法 (软件 查询 或 形成 向 量 地 址 ) 。 

(20) 了 解 中 断 服务 程序 的 结构 框架 ( 即 中 断 处 理 过 程 ) 。 
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(21) 理解 断 点 保护 和 现场 保护 的 不 同 。 

(22) 掌握 现场 保护 和 恢复 的 方法 。 

(23) 了 解 中 断 允 许 触 发 器 的 作用 以 及 应 在 何 时 开 / 关 中 断 。 
(24) 理解 中 断 服务 程序 调用 和 子 程序 调用 的 差别 。 

(25) 理解 中 断 接 口 电 路 (中 断 控 制 器 ) 的 结构 。 

(26) 理解 多 重 中 断 和 中 断 屏 蔽 的 概念 。 

(27) 理解 获取 中 断 服 务 程序 入 口 地 址 的 过 程 。 

(28) 理解 中 断 服务 程序 调用 和 子 程序 调用 的 差别 。 

(29) 理解 为 什么 要 在 中 断 处 理 开始 时 保护 现场 、 结 束 时 恢复 现场 。 
(30) 了 解 DMA 方式 适用 的 场合 和 特点 。 

(31) 掌握 DMA 传送 的 过 程 。 

(32) 理解 中 断 方式 和 DMA 方式 的 差别 。 


输入 输出 组 织 主要 指 用 于 控制 外 设 与 内 存 、 外 设 与 CPU 之 间 进 行 数 据 交 换 的 软 、 硬 件 
系统 。 实 现 输入 输出 功能 的 关键 是 要 解决 以 下 一 系列 的 问题 : 如 何在 CPU 、. 主 存 和 外 设 之 
间 建 立 一 个 高 效 的 信息 传输 “通路 ,怎样 将 用 户 的 1/O 请 求 转换 成 对 设备 的 控制 命令 ,如 
何 使 CPU 方便 地 寻找 到 要 访问 的 外 设 ,1/O 硬件 和 1/O 软件 如 何 协调 完成 主机 和 外 设 之 间 
的 数据 传送 ,等 等 。 因 此 ,本 章 的 内 容 应 围绕 这 些 问题 展开 讲解 。 

本 章 的 内 容 主要 包括 常用 输入 输出 设备 .外 部 存储 设备 .外 设 与 CPU 和 主 存 的 互 连 、 
1/O 接口 和 I/VO 数据 传输 控制 方式 5 个 方面 。 

对 于 常用 输入 输出 设备 ,因为 设备 的 工作 原理 不 属于 主干 内 容 ,而 且 不 同 设 备 的 工作 原 
理 差 别 较 大 ,所 以 ,在 课时 有 限 的 情况 下 ,关于 键盘 鼠标 器 .打印 机 和 显示 器 等 的 工作 原理 
可 以 跳 过 不 讲 。 但 是 ,如 果 学 生 对 1/O 设备 的 功能 和 结构 一 点 不 了 解 ,那么 ,要 理解 后 续 的 
如 1/O 接口 等 内 容 就 比较 困难 ,因此 ,可 以 简单 讲解 一 下 1/O 设备 的 通用 结构 ,以 便 让 学 生 
明白 : 设备 与 计算 机 主机 之 间 有 数据 交换 ,如 键盘 和 鼠标 器 的 输入 信息 .打印 机 和 显示 器 的 
输出 信息 等 ;计算 机 主机 会 向 设备 发 送 控制 信息 ,如 打印 机 的 初始 化 、 选 通 、 自 动 走 纸 等 命 
今 ;设备 会 向 计算 机 主机 回 送 状态 信息 ,如 打印 机 忙 、 缺 纸 、 联 机 等 状态 信息 。 

对 于 外 部 存储 设备 ,因为 它 是 存储 器 分 层 体系 结构 中 的 一 个 重要 组 成 部 分 ,所 以 它 属于 
主干 内 容 , 特 别 是 硬盘 存储 器 , 它 与 操作 系统 中 的 存储 管理 和 设备 管理 都 有 很 大 的 关联 , 因 
此 ,本 课程 中 应 该 把 硬盘 存储 器 讲 清楚 ,包括 性 能 指标 . 读 写 原理 、 硬 盘 驱动 器 的 内 部 结构 、 
硬盘 控制 器 的 结构 和 功能 、 磁 道 和 扇 区 记录 格式 等 。 关 于 宛 余 磁盘 阵列 (RAID) ,因为 其 应 
用 的 广泛 性 ,作为 计算 机 专业 的 学 生 必须 对 其 有 一 定 的 了 解 ,课时 有 限 的 情况 下 ,可 以 把 
RAID 技术 的 基本 思想 基本 实现 原理 简单 介绍 一 下 。 对 于 U 盘 、 移 动 硬盘 固态 硬件 、 磁 
带 存储 器 .光盘 存储 器 等 ,在 课时 有 限时 ,也 可 以 不 展开 来 细 讲 ,而 是 主要 介绍 基本 原理 和 主 
要 使 用 场合 。 

对 于 外 设 与 CPU 和 主 存 的 互 连 , 着 重 介 绍 用 于 互 连 的 系统 总 线 所 涉及 的 概念 和 知识 
体系 。 在 此 之 前 ,学 生 已 经 对 指令 的 执行 .存储 器 的 层次 结构 .CPU 设计 等 方面 的 内 容 有 所 
了 解 ,因此 ,可 以 从 指令 执行 过 程 中 涉及 的 部 件 之 间 的 数据 交换 开始 讲 起 ,将 总 线 和 指令 执 
行 过 程 ,总 线 和 CPU .cache、 存 储 器 .显卡 等 I/O 接口 联系 起 来 ,说 明 指令 执行 过 程 中 可 能 
需要 在 哪些 部 件 之 间 进行 数据 交换 ,以 及 在 每 次 数据 交换 过 程 中 ,在 部 件 之 间 需 要 传送 哪些 
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信息 ,并 说 明 传 送 这 些 信 息 的 任务 就 是 由 总 线 完成 的 。 这 样 , 既 复习 了 所 学 的 概念 和 知识 ， 
又 将 相关 内 容 串 接 了 起 来 ,并且 使 得 学 生 在 学 习 具 体 的 有 关 总 线 设计 的 内 容 之 前 ,对 总 线 的 
组 成 .职责 和 总 线 在 计算 机 中 的 位 置 有 较为 全 面 的 了 解 ,从 而 有 利于 学 生 对 有 关 总 线 设计 内 
容 的 理解 。 

对 于 I/O 接口 ,因为 不 同 设备 对 应 的 1/O 接口 的 结构 相差 很 大 ,而 且 各 种 接口 的 类 型 
也 很 多 ,有 限 的 课时 无 法 讲 清楚 所 有 1/O 接口 的 实现 细节 ,所 以 ,本 章 应 主要 关注 1/O 接口 
的 通用 结构 和 一 般 的 功能 。 这 部 分 内 容 中 ,有 关 操 作 系 统 对 1/O 的 支持 ,上 课时 可 以 跳 过 
不 讲 , 但 是 ,如 果 学 生 课 后 能 够 很 好 地 阅读 这 部 分 内 容 , 则 对 于 学 生理 解 用 户 程序 和 操作 系 
统 之 间 的 关系 、 操 作 系统 和 硬件 之 间 的 关系 都 有 好 处 ,从 而 能 更 好 地 理解 计算 机 的 层次 化 
结构 。 

对 于 1/0 传送 控制 方式 ,主要 要 求 对 程序 直接 控制 ,中断 和 DMA 三 种 基本 1/0 方式 有 
所 掌握 。 首 先 , 讲 清楚 这 些 I/O 方式 的 基本 实现 原理 ;接着 ,从 C 语言 的 标准 I/O 库 函 数 
(如 printf() 函 数 ) 出 发 ,说 明 这 些 1/O 库 函 数 的 大 致 实现 过 程 ,使 学 生 能 深入 理解 输入 输出 
子 系统 的 层次 结构 ,并 深刻 理解 硬件 和 操作 系统 之 间 如 何 协调 完成 输入 输出 操作 ,特别 是 深 
刻 理解 1/O 方式 与 操作 系统 层次 中 驱动 程序 之 间 的 关系 。 


8.2 主要 内 容 提 要 


1. 外 部 设备 及 其 与 主机 的 互 连 

输入 设备 ,输出 设备 和 外 存储 器 统称 为 外 部 设备 ,简称 外 设 。 像 键盘 、 鼠 标 、 针 式 打印 机 
等 设备 每 次 按 单个 数据 为 单位 进行 交换 ,属于 字符 型 设备 ;磁盘 、 光 盘 、 扫 描 仪 等 设备 一 旦 被 
启动 后 ,每 次 都 会 交换 一 块 数据 ,因此 ,属于 成 块 传送 设备 。 

所 有 外 设 通 过 相应 的 电缆 (通信 总 线 ) 连 到 I/O 接口 电路 上 ,1/O 接口 电路 再 通过 IO 
总 线 连 到 主板 上 ,最 终 通过 存储 器 总 线 和 处 理 器 总 线 与 主 存 和 CPU 相连 。 

2. 常用 输入 、 输 出 设备 

常用 的 输入 设备 有 键盘 鼠标、 扫描 仪 等 。 键 盘 通过 串 行 方式 向 主机 输入 信息 ,通常 所 
用 的 键盘 为 非 编 码 键 盘 , 从 键盘 送 到 主机 侧 键盘 接口 电路 中 的 是 按键 的 扫描 码 ,即位 置 码 。 
鼠标 器 也 是 通过 串 行 方式 向 主机 传送 信息 ,输入 的 是 鼠标 移动 的 位 置信 息 。 

常用 的 输出 设备 有 打印 机 和 显示 器 等 。 打 印 机 有 针 式 、 激 光 和 喷 墨 三 类 打印 机 ,它们 各 
自 适 用 的 场合 不 同 ,所 用 的 打印 技术 也 不 一 样 。 激 光 打印 机 比较 复杂 一 些 , 它 由 打印 控制 器 
和 打印 部 件 两 部 分 组 成 ,分 别 用 于 打印 控制 和 打印 。 打 印 控制 器 中 包含 功能 较 强 的 专门 用 
于 打印 控制 的 处 理 器 ,缓冲 存储 器 和 其 他 辅助 电路 ,可 实现 对 打印 语言 的 解释 、 页 面 内 容 的 
格式 化 和 光栅 化 (转换 为 点 阵 数据 ) 等 处 理 。 显 示 器 有 CRT ,液晶 (LCD) 和 等 离子 显示 器 
等 ,目前 使 用 较 多 的 是 液晶 显示 器 。 显 示 器 显示 的 信息 是 离散 的 像素 点 ,显示 器 的 主要 参数 
有 分 辨 率 、 行 频 、 帧 频 (刷新 频率 ) 等 。 屏 幕 上 的 点 的 颜色 用 R.G、B 三 个 分 量 来 表示 ,其 位 数 
之 和 就 是 颜色 深度 ,每 个 点 的 颜色 值 存放 在 显示 存储 器 (VRAM ,简称 显存 ) 中 。 在 主机 和 
显示 器 之 间 有 一 个 显示 控制 器 ,可 集成 在 主板 上 ,也 可 以 以 显卡 的 形式 插 在 I/O 总 线 槽 中 。 
显存 通常 集成 在 显卡 中 ,为 了 快速 处 理 3D 图 形 ,通常 在 显卡 中 配置 专门 用 于 图 形 处 理 的 绘 
图 处 理 器 (GPU) ,此 时 ,显存 不 仅 用 来 存放 屏幕 位 图 信息 ,更 主要 的 是 用 来 存放 GPU 芯片 
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处 理 过 或 者 即将 处 理 的 像素 数据 和 泻 染 数据 。 

3. 常用 外 部 存储 器 

常用 的 外 部 存储 器 有 磁盘 、 闪 存盘 、 磁 带 库 和 光盘 库 。 磁 盘 主 要 用 作 主 存 的 辅助 存储 
器 ,存放 计算 机 系统 的 所 有 信息 ;闪存 盘 以 U 盘 、 外 接 硬盘 或 内 装 的 固态 硬盘 形式 出 现 ; 磁 
带 库 和 光盘 库 主要 用 作 备 份 数据 的 后 备 存储 器 。 

磁盘 和 磁带 都 是 磁 表 面 存储 器 ,其 基本 存储 原理 一 样 。 磁 盘存 储 器 的 主要 技术 指标 
如 下 。 

(1) 记录 密度 : 道 密度 指 单位 长 度 上 的 磁道 数 ; 位 密度 为 磁道 中 单位 长 度 上 的 位 数 。 

(2) 平均 存 取 时 间 : 平均 寻 道 时 间 和 平均 等 待 时 间 之 和 (数据 传输 时 间 相 对 较 小 ,可 忽 
略 不 计 )。 平 均 寻 道 时 间 指 移动 磁头 到 所 读 写 磁道 的 平均 时 间 ; 平 均等 待 时 间 指 要 读 写 的 扇 
区 旋转 到 磁头 下 方 所 需 的 平均 时 间 , 等 于 磁盘 旋转 一 圈 所 花 时 间 的 一 半 。 

(3) 数据 传输 率 : 分 为 内 部 数据 传输 率 和 外 部 数据 传输 率 。 内 部 数据 传输 率 与 磁盘 转 
速 有 关 , 指 寻 道 和 旋转 等 待 后 ,单位 时 间 内 从 存储 介质 上 读 出 或 写 和 的 二 进 制 信息 量 。 外 部 
数据 传输 率 与 磁盘 转速 无 关 , 指 磁盘 接口 (磁盘 控制 器 ) 和 磁盘 缓存 之 间 进 行 数据 交换 的 数 
据 传输 率 。 

4. 宛 余 磁盘 阵列 RAID 

RAID 技术 的 主要 实现 思想 是 通过 多 个 物理 盘 的 交叉 存储 和 访问 ,提高 访问 速度 ,并 增 
加 存储 容量 ;同时 ,通过 在 盘 上 增加 校 验 信息 ,以 提高 磁盘 的 可 靠 性 。 根 据 交 叉 存 储 块 大 小 
的 不 同 ,可 以 有 小 条 带 方式 和 大 条 区 方式 。 对 于 小 条 带 分 布 方式 ,因为 一 个 IO 请 求 分 布 
在 所 有 物理 盘 中 ,而 所 有 盘 都 可 以 并 行 访 问 , 所 以 其 数据 传输 率 比 单个 盘 的 情况 要 高 很 多 
倍 ,因而 适合 应 用 于 流 媒 体 播放 系统 ;对 于 大 条 区 分 布 方式 ,因为 每 个 交叉 存储 的 数据 块 较 
大 ,使 得 小 数据 量 的 1/O 请 求 只 要 访问 一 个 物理 盘 , 多 个 物理 盘 可 以 响应 多 个 1/O 请 求 ,所 
以 其 1/O 响应 速度 较 快 ,适合 应 用 于 银行 .证 券 等 事务 处 理 系统 。 

RAID 级 别 有 RAID0~RAID7, 并 派生 出 了 RAID10、RAID30 和 RAID50 等 。 目 前 广 
泛 使 用 的 是 RAID0、RAID1 和 RAID5 等 。 

5. 总 线 的 概念 和 分 类 

总 线 是 计算 机 系统 中 部 件 或 设备 之 间 传 送信 息 的 公共 通路 ,包括 传输 介质 和 相应 的 控 
制 逻辑 。 根 据 总 线 所 在 位 置 ,可 以 分 为 内 部 总 线 ,、 系 统 总 线 和 通信 总 线 三 类 。 内 部 总 线 指 芯 
片 内 部 连接 各 元 件 的 总 线 ,如 CPU 内 部 总 线 。 系 统 总 线 指 在 计算 机 的 主要 功能 部 件 
(CPU , 主 存 .IVO 接口 ) 之 间 传 送信 息 的 总 线 , 由 数据 线 、 地 址 线 和 控制 线 组 成 。 根 据 所 处 位 
置 和 功能 的 不 同 , 系 统 总 线 又 可 分 为 处 理 器 总 线 、 存 储 器 总 线 和 I/O 总 线 。 通 常 处 理 器 总 
线 和 存储 器 总 线 是 专用 总 线 ,而 IO 总 线 是 标准 总 线 ,如 PCI 总线.AGP 总 线 ,PCI-Express 
总 线 等 。 通 信息 线 指 用 于 主机 和 IVO 设备 之 间或 计算 机 系统 之 间 通 信 的 总 线 , 如 RS-232 
串 行 总 线 `.USB 串 行 总 线 .SCSI 总 线 等 。 

6. 总 线性 能 和 设计 要 素 

最 重要 的 总 线性 能 是 总 线 带宽 。 总 线 带宽 指 总 线 的 最 大 数据 传输 率 , 即 在 数据 传输 阶 
段 单 位 时 间 内 总 线 上 可 传输 的 数据 量 。 它 与 总 线 数据 线 的 宽度 .总线 时 钟 频率 和 传送 每 个 
数据 所 需 的 时 钟 周期 数 等 有 关 。 

总 线 的 基本 定时 方式 有 同步 和 异步 两 种 ,在 这 两 种 基本 定时 方式 基础 上 ,又 派生 出 半 同 
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步 和 分 离 事务 两 种 定时 方式 。 同 步 方式 用 一 个 公共 的 时 钟 信号 对 传输 过 程 的 每 个 步骤 进行 
同步 控制 ;异步 方式 用 异步 应 答 ( 握 手 ) 信 号 对 传输 过 程 的 每 个 步骤 进行 定时 控制 ; 半 同 步 方 
式 将 同步 和 异步 方式 结合 起 来 进行 定时 , 即 在 时 钟 的 同步 控制 下 发 出 和 采样 异步 应 答 信号 ; 
分 离 事务 方式 把 传输 过 程 分 成 两 个 阶段 ,使 得 从 设备 在 准备 数据 时 总 线 被 释放 给 其 他 设备 
使 用 。 

总 线 事务 类 型 指 在 总 线 上 进行 的 不 同 信息 传输 类 型 ,如 存储 器 读 、 存 储 器 写 .I/O 读 、 
1/O 写 ,中 断 响应 等 。 有些 总 线 事务 要 求 完 成 一 连 串 连续 单元 的 读 写 ,如 从 存储 器 读 一 个 
cache 行 或 写 一 个 cache 行 到 主 存 , 这 种 情况 下 ,一 个 总 线 事务 完成 多 个 数据 的 读 写 , 称 为 突 
发 (burst) 传 输 方 式 。 

在 多 个 主 控 设备 共享 总 线 的 情况 下 ,需要 进行 总 线 裁决 ,有 集中 式 裁决 和 分 布 式 裁决 两 
类 。 不 过 ,目前 总 线 的 发 展 趋势 是 点 对 点 连接 方式 ,而 不 是 早期 多 设备 共享 方式 ,所 以 无 须 

早期 的 系统 总 线 多 采用 多 数据 线 并 行 传输 的 同步 总 线 ,因为 这 种 总 线 需要 在 多 个 数据 
位 之 间 进 行 同 步 ,限制 了 总 线 的 时 钟 频率 ,因而 目前 总 线 的 发 展 趋势 多 采用 串 行 传输 方式 。 
例如 早期 曾经 流行 的 IO 总 线 标准 ISA、EISA.PCI.APG 等 都 是 并 行 传输 的 同步 总 线 , 现 
在 主要 采用 串 行 总 线 标准 PCI-Express。 

7. 1/0 接口 的 职能 、 结 构 和 类 型 

1/O 接口 是 用 于 连接 主机 和 外 设 并 通过 接受 主机 命令 来 对 外 设 进行 控制 的 部 件 的 总 
称 。 例 如 ,显卡 、 网 卡 、 打 印 控制 器 \ 磁 盘 控 制 器 等 都 属于 I/O 接口 ,有 时 也 称 为 1/O 模块 。 

不 同 设备 对 应 的 1/0 接口 的 功能 不 完全 相同 ,其 逻辑 结构 也 不 一 样 。 但 是 ,所 有 IO 
接口 的 基本 结构 和 职能 是 类 似 的 。1/O 接口 中 ,有 用 于 存放 输入 输出 数据 的 数据 缓冲 器 .用 
于 记录 设备 或 接口 状态 的 状态 寄存 器 ,用 于 存放 控制 信息 的 命令 (控制 ) 寄 存 器 等 ,这 些 寄存 
器 分 别称 为 数据 端口 ,状态 端口 和 命令 端口 。I/O 接口 在 主机 一 侧 ,通过 I/O 总 线 与 主机 相 
连 , 在 外 设 一 侧 通过 通信 和 总 线 ( 电 费 ) 与 外 设 相 连 。 通 常 I/O 总 线 和 通信 息 线 的 数据 宽度 不 
同 , 因 此 ,在 主机 侧 和 外 设 侧 的 数据 宽度 不 一 样 ,因而 在 1/O 接口 中 需要 有 进行 数据 格式 转 
换 的 旭 辑 电路 ,此 外 ,还 需 在 主机 侧 和 外 设 侧 分 别 有 相 应 的 总 线 接口 逻辑 ,以 支持 与 IO 总 
线 和 通信 总 线 的 连接 。 

1/O 接口 的 类 型 多 种 多 样 。 按 设备 侧 传输 的 位 数 来 分 ,有 并 行 接口 和 串 行 接口 ; 按 是 否 
可 以 编程 控制 来 分 ,有 可 编程 接口 和 不 可 编程 接口 ; 按 是 否 支 持 标准 的 通信 总 线 来 分 ,有 通 
用 接口 和 专用 接口 ; 按 I/O 方式 来 分 ,有 无 条 件 查询 接口 .条件 查 询 接口 .中 断 控制 器 接口 、 
DMA 控制 器 接口 ; 按 连接 方式 来 分 ,有 点 对 点 接口 和 多 点 总 线 式 接口 。 

8. 1/0 端口 及 其 编 址 

1/O 端口 指 1/O 接口 中 程序 可 访问 的 寄存 器 ,有 数据 端口 ,命令 端口 和 状态 端口 。 通 常 
用 户 程序 不 访问 这 些 1/O 端口 ,而 由 操作 系统 中 的 驱动 程序 访问 。 为 了 使 指令 能 够 访问 到 
1/O 端口 ,需要 对 它们 进行 编号 , 称 为 I/O 端口 编 址 (有 时 称 为 设备 编 址 ,实际 上 并 不 是 对 设 
备 编 址 ) 。 

I/O 端口 编 址 有 独立 编 址 和 统一 编 址 两 种 方式 。 独 立 编 址 方式 下 ,对 I/O 端口 单独 编 
号 ,使 它们 成 为 一 个 独立 的 1/O 地 址 空间 ,此 时 ,I/O 端口 号 可 能 和 主 存单 元 号 相同 ,因此 ， 
从 地 址 形式 上 无 法 区 分 指令 访问 的 是 1/O 端口 还 是 主 存 单元 ,需要 通过 不 同 的 操作 码 来 区 
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分 ,因而 需要 提供 专门 的 I/O 指令 来 控制 对 I/O 端口 的 访问 。 统 一 编 址 方式 下 ,I/O 端口 与 
主 存 地 址 空间 统一 编号 ,将 主 存 地 址 空间 分 出 一 部 分 地 址 编号 给 IO 端口 进行 编号 ,因此 ， 
也 被 称 为 存储 器 映射 方式 。 因 为 主 存单 元 和 1/O 端口 在 同一 个 地 址 空间 ,所 以 , 主 存单 元 
号 和 1/O 端口 号 肯定 不 会 相同 ,它们 分 属 两 个 不 同 的 地 址 范围 ,因此 ,通过 指令 给 出 的 地 址 
范围 就 可 以 确定 访问 的 是 主 存单 元 还 是 1/O 端口 ,因而 指令 系统 无 须 提供 专门 的 IO 
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9. 常用 1/0 控制 方式 
目前 ,计算 机 中 常用 的 1/0 方式 有 程序 直接 控制 ,中断 控制 和 DMA 控制 三 种 。 
程序 直接 控制 方式 分 无 条 件 传送 和 条 件 传送 方式 。 无 条 件 传送 方式 利用 程序 定时 传送 
数据 ,无 须 检 测 接口 或 设备 的 状态 ,适合 于 各 类 巡回 检测 或 过 程控 制 ;条 件 传送 方式 也 称 为 
程序 查询 方式 ,CPU 通过 查询 外 设 接 口中 的 “就 绪 ”(Ready)、“ 忙 ”(Busy) 和 “完成 ”(Done) 
等 状态 来 控制 数据 的 传送 ,有 定时 查询 和 独占 查询 两 种 ,独占 查询 方式 下 ,CPU 在 整个 数据 
交换 过 程 中 一 直 为 设备 的 I/O 服务 。 

中 断 控制 方式 也 是 一 种 通过 执行 程序 来 进行 数据 交换 的 1/O 方式 。 当 外 设 准备 好 数 
据 \ 准 备 好 接收 新 数据 ,发 生 了 特殊 事件 时 ,外 设 通过 向 CPU 发 中 断 请 求 来 使 CPU 转 到 相 
应 的 中 断 服务 程序 去 执行 ,在 中 断 服 务 程序 中 完成 数据 交换 或 处 理 特殊 事件 。 中 断 方式 下 ， 
由 硬件 和 软件 共同 完成 中 断 过 程 ,首先 ,由 1/O 接口 向 CPU 发 中 断 请 求 ,CPU 每 执行 完 一 
条 指令 都 去 采样 中 断 请 求 线 ,一 旦 发 现 有 中 断 请 求 ,并 且 处 于 “ 开 中 断 ( 中 断 允许 )” 状 态 ， 
CPU 就 进入 "中 断 响应 ”周期 ,自动 执行 一 条 隐 指 令 ,完成 关中 断 、 保 护 断 点 .识别 中 断 源 
3 项 任务 ,识别 中 断 源 的 结果 就 是 将 中 断 服务 程序 的 首 地 址 送 到 PC 中 “中断 响应 ”周期 结 
束 ,CPU 就 根据 PC 的 值 开 始 执行 中 断 服务 程序 。 在 单 级 中 断 系统 中 ,中 断 服务 程序 执行 
过 程 中 一 直 不 会 开 中 断 ,直到 中 断 返 回 前 才 执 行 “ 开 中 断 ? 指 令 ; 而 多 级 中 断 系统 中 ,中 断 处 
理 过 程 可 能 被 其 他 新 中 断 打 断 ,是 否 允 许 打 断 是 通过 在 每 个 中 断 服 务 程序 中 设置 中 断 屏 项 
字 来 实现 的 ,中 断 服务 程序 中 还 要 进行 现场 的 保护 和 恢复 。 

DMA 控制 方式 适合 像 磁盘 一 类 的 高 速 设备 以 成 批 方式 和 主 存 直 接 交 换 数 据 。 首 先 要 
对 DMA 控制 器 进行 初始 化 ;然后 由 DMA 控制 器 控制 总 线 在 主 存 和 高 速 设备 之 间 进 行 直 
接 数 据 交换 ;最 后 ,DMA 控制 器 发 出 *DMA 传送 结束 ”信号 给 外 设 接口 ,由 外 设 接口 发 中 断 
请 求 给 CPU ,由 CPU 执行 相应 的 中 断 服务 程序 来 进行 数据 校 验 等 ,最 终 完 成 DMA 传送 
处 理 。 

10. 1/0 子 系统 的 层次 结构 

所 有 用 户 程序 中 提出 的 1/O 请 求 最 终 都 是 通过 系统 调用 实现 的 ,通过 系统 调用 封装 函 
数 中 的 陷阱 指令 转 入 内 核 空间 的 1/O 软件 执行 。 内 核 空间 的 I/O 软件 分 三 个 层次 ,分 别 是 
与 设备 无 关 的 I/O 软件 层 ,设备 驱动 程序 层 和 中 断 服务 程序 层 , 其 中 ,后 两 个 层次 与 1/0 硬 
件 密切 相关 。 前 面 提 到 的 中 断 .DMA 等 I/O 方式 实际 上 是 指 驱 动 程序 中 软件 和 1/O 硬件 
打交道 的 方式 ,因而 决定 了 驱动 程序 的 模块 结构 ,这 部 分 是 典型 的 软件 和 硬件 密切 关联 的 。 
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8.3 基本 术语 解释 


1/O 带宽 (I/O bandwidth) 

单位 时 间 内 系统 输入 /输出 的 数据 量 或 所 完成 的 1/O 操作 次 数 。 即 指 在 一 定时 间 内 所 
完成 的 工作 量 ,也 称 为 吞吐 率 (Throughput) 。 

响应 时 间 (response time) 

也 称 等 待 时 间 (latency) ,是 指 从 作业 提交 开始 到 作业 完成 所 用 的 时 间 。 

外 设 (device) 

外 部 (辅助 ) 存 储 设备 和 输入 设备 ,输出 设备 统称 为 外 设 。 也 称 为 外 围 设备 ,外 部 设备 或 
1/O 设 备 。 

输入 设备 (input device) 

输入 设备 的 作用 是 将 程序 原始 数据 文字、 图像 .控制 命令 或 现场 采集 的 数据 等 信息 输 
入 到 计算 机 。 常 见 的 输入 设备 有 键盘 .鼠标 器 扫描 仪 等 。 

输出 设备 (output device) 

输出 设备 把 计算 机 的 中 间 结 果 或 最 后 结果 ,机 内 的 各 种 数据 符号 及 文字 或 各 种 控制 信 
号 等 信息 以 某 种 形式 输出 到 计算 机 外 部 。 常 用 的 输出 设备 有 显示 终端 (CRT、LCD)、 打 印 
机 \ 绘 图 仪 等 。 

外 部 存储 设备 (storage device) 

各 种 外 部 存储 器 称 为 外 部 存储 设备 ,简称 外 存 或 辅 存 。 可 以 把 信息 从 外 部 存储 设备 输 
人 到 主 存 ,也 可 以 把 主 存 中 的 信息 输出 到 外 部 存储 设备 上 保存 。 典 型 的 外 存 有 硬盘 、 闪 存 、 
光盘 和 磁带 等 。 

终端 (terminal) 

终端 是 指 一 种 由 CRT 显示 器 、 控 制 器 及 键盘 合 为 一 体 的 设备 , 它 与 微型 计算 机 的 根本 
区 别 是 没有 自己 的 中 央 处 理 单元 (CPU) ,当然 也 没有 自己 的 内 存 , 其 主要 功能 是 将 键盘 输 
入 的 请 求 数据 发 往 主机 (或 打印 机 ) 并 将 主机 运算 的 结果 显示 出 来 。 对 互联 网 而 言 ,终端 泛 
指 一 切 可 以 接 入 网 络 的 计算 设备 ,如 个 人 计算 机 、 网 络 电视 ,可 上 网 手机 、PDA 等 。 

磁道 (track) 

磁盘 在 高 速 旋转 时 ,磁头 相对 于 磁盘 表面 做 相对 运动 。 相 对 运动 时 磁头 在 盘面 上 所 经 
过 的 路 径 构成 一 个 磁道 。 磁 头 在 不 同 的 位 置 ,磁盘 表面 就 形成 不 同 半径 的 同心 圆 , 因 此 ,每 
个 同心 圆 为 一 个 磁道 。 每 个 磁道 都 有 一 个 编号 ,最 外 面 的 是 0 磁道 。 

柱 面 (cylinder) 

在 一 个 磁盘 驱动 器 中 的 若干 个 盘 片 都 连 到 同一 个 中 心 轴 上 ,每 个 可 读 写 的 盘面 上 都 有 
一 个 磁头 ,这 些 不 同 盘 面 上 的 磁头 被 连 在 一 起 且 同 时 按 相同 的 轨迹 移动 。 因 此 ,在 不 同 盘面 
上 的 磁头 总 是 处 在 相同 半径 的 磁道 上 ,所 有 盘面 上 的 这 些 磁道 构成 一 个 柱 面 。 因 此 , 柱 面 号 
和 磁道 号 是 一 样 的 。 磁 头号 和 盘面 号 是 一 样 的 。 

扇 区 (sector) 

每 个 磁道 被 划分 为 若干 段 ( 段 又 叫 扇 区 ) ,每 个 扇 区 的 存储 容量 为 512B 或 4096B。 每 个 
肩 区 都 有 一 个 编号 。 扇 区 是 磁盘 的 最 小 编 址 单位 ,因此 ,到 磁盘 上 寻找 数据 时 ,只 需 定位 到 
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相应 的 扇 区 。 读 写 数据 时 可 能 会 以 多 个 扇 区 为 单位 进行 传输 。 

道 密度 (track density) 

沿 磁盘 半径 方向 单位 长 度 上 的 磁道 数 称 为 道 密度 。 道 密度 的 单位 是 道 /英寸 (英文 表示 
为 tpi, 是 track per inch 的 缩写 ) 或 道 /毫米 (tpm)。 道 密度 是 相 邻 磁道 间距 的 倒数 。 

位 密度 (bit density) 

沿 磁道 方向 上 单位 长 度 所 记录 的 二 进 制 信息 位 叫 位 密度 或 线 密度 ,早期 的 磁盘 ,每 个 磁 
道 所 含 信息 量 一 样 。 这 样 的 磁盘 因为 每 个 磁道 的 周 长 不 同 , 使 得 每 个 磁道 的 位 密度 也 不 同 。 
一 般 磁 盘 的 位 密度 是 指 最 内 圈 上 的 位 密度 。 单 位 是 位 /英寸 或 位 /毫米 (英文 表示 为 bpi 或 
bpm)。 现 在 也 有 一 些 磁盘 的 磁道 采用 固定 位 密度 方式 ,因而 在 外 圈 的 磁道 上 可 以 比 内 圈 的 
磁道 上 多 记录 一 些 信息 。 

磁盘 平均 存 取 时 间 (average access time) 

操作 系统 必须 通过 三 个 步骤 对 磁盘 进行 操作 : 寻 道 (seek) ,旋转 (rotation) 、 读 写 数据 。 
因为 读 写 数据 所 用 时 间 相对 于 前 两 个 操作 而 言 可 以 忽略 不 计 ,所 以 ,通常 将 前 两 个 操作 时 间 
的 平均 值 之 和 称 为 磁盘 平均 存 取 时 间 。 即 平均 存 取 时 间 等 于 平均 寻 道 时 间 加 平均 旋转 
时 间 。 

平均 寻 道 时 间 (average seek time) 

移动 磁头 使 磁头 定位 到 要 读 写 的 磁道 上 的 操作 称 为 寻 道 (seek)。 平 均 寻 道 时 间 取 决 于 
相 邻 两 道 之 问 的 寻 道 时 间 , 称 为 道 间 移 动 时间 , 工 业 上 也 把 它 称 为 最 小 寻 道 时间 。 平 均 寻 道 
时 间 有 很 多 种 测量 方法 ,最 简单 的 方法 就 是 把 最 长 寻 道 时 间 除 以 2。 最 长 寻 道 时 间 就 是 从 
最 内 (外 ) 移 过 所 有 磁道 到 最 外 (内 ) 的 时 间 。 

平均 旋转 时 间 (average rotational latency/delay) 

磁头 定位 在 要 读 写 的 磁道 后 ,磁盘 开始 旋转 直到 磁头 正好 落 在 要 读 写 的 数据 上 方 , 通 党 
把 完成 这 个 过 程 的 时 间 称 为 旋转 (等 待 ) 时 间 。 平 均 旋 转 时 间 是 磁盘 转 一 圈 的 时 间 的 一 半 。 

传输 时 间 (transfer time) 

当 磁 头 正好 落 在 要 读 写 数据 的 起 点 后 ,就 开始 读 / 写 数据 ,磁盘 读 / 写 一 块 数据 ( 即 一 个 
扇 区 ) 的 时 间 为 传输 时 间 。 它 是 扇 区 大 小 .旋转 速度 、. 磁 道上 位 密度 的 函数 。 

磁盘 数据 传输 率 (transfer rate) 

分 为 外 部 数据 传输 率 和 内 部 数据 传输 率 两 种 。 外 部 数据 传输 率 指 主机 接口 从 (向 ) 硬 盘 
缓存 读 出 ( 写 人 ) 数 据 的 速度 ;内 部 数据 传输 率 指 磁头 定位 在 要 读 写 的 数据 块 的 始 端 后 ,单位 
时 间 内 连续 从 磁道 中 读 出 或 写 入 的 二 进 制 数据 的 位 数 。 

磁盘 控制 器 (disk controller) 

指 用 来 控制 磁盘 进行 数据 读 写 , 并 控制 数据 在 磁盘 和 主 存 间 进 行 传输 的 部 件 。 因 此 ,一 
次 磁盘 读 写 操作 除了 寻 道 旋转、 传输 三 个 操作 时 间 以 外 ,还 要 加 上 磁盘 控制 器 所 用 的 时 间 。 

廉价 磁盘 宛 余 阵列 (Redundant Arrays of Inexpensive Disk, RAID) 

将 多 个 独立 操作 的 磁盘 按 某 种 方式 组 织 成 磁盘 阵列 ,以 增加 容量 ,利用 类 似 于 主 存 中 的 
多 体 交 叉 技 术 ,将 数据 存储 在 多 个 盘 上 ,通过 使 这 些 盘 并 行 工作 来 提高 数据 传输 速度 ,并 用 
宛 余 磁盘 技术 提高 系统 可 靠 性 。 

总 线 (bus) 

是 共享 的 信息 传输 介质 ,用 于 连接 若干 设备 ,由 一 组 传输 线 组 成 ,信息 通过 这 组 传输 线 
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在 设备 之 间 被 传送 。 总 线 按 其 所 在 的 位 置 分 为 片 内 总 线 、 系 统 总 线 和 通信 总 线 。 

片 内 总 线 (internal bus) 

指 芯片 内 部 连接 各 元 件 的 总 线 。 例 如 ,在 CPU 芯片 内 部 ,存在 连接 在 各 个 寄存 器 、 
ALU 等 各 元 件 之 间 的 总 线 。 

系统 总 线 (system bus) 

是 用 来 连接 计算 机 硬件 系统 中 若干 主要 部 件 (如 CPU\ 主 存 .1/O 模块 ) 的 总 线 。 系 统 
总 线 上 传输 的 有 数据 .地址 和 控制 信息 。 因 此 把 系统 总 线 也 分 成 三 组 传输 线 : 数据 线 、 地 址 
线 和 控制 线 , 有 时 也 把 它们 分 别称 为 数据 总 线 .地 址 总 线 和 控制 总 线 。 系 统 总 线 可 分 为 处 理 
器 总 线 .存储 器 总 线 和 I/O 总 线 。 

注 : Intel 公司 推出 的 芯片 组 中 ,对 系统 总 线 赋 予 了 特定 的 含义 ,把 CPU 连接 到 北桥 芯 
片 的 总 线 称 为 系统 总 线 ,也 称 为 处 理 器 总 线 或 前 端 总 线 (Front Side Bus,FSB)。CPU 通过 
前 端 总 线 连接 到 北桥 芯片 ,进而 通过 北桥 芯片 和 内 存 、 显 卡 交换 数据 。 

处 理 器 总 线 (processor bus) 

早期 的 Intel 微 处 理 器 的 处 理 器 总 线 称 为 前 端 总 线 (FSB) , 它 是 主板 上 最 快 的 总 线 , 主 
要 用 作 处 理 器 与 北桥 芯片 进行 信息 交换 。 

Intel 公司 推出 Core i7 时 ,北桥 芯片 的 功能 被 集成 到 了 CPU 芯片 内 ,CPU 通过 存储 器 
总 线 ( 即 内 存 条 插 槽 ) 直 接 和 内 存 条 相连 ,而 在 CPU 芯片 内 部 的 核 与 核 之 间 、CPU 芯片 与 其 
他 CPU 芯片 之 间 , 以 及 CPU 芯片 与 IJOH (Input/Output Hub) 芯 片 之 间 , 则 通过 QPI 
(QuickPath Interconnect) 总 线 相连 。 

存储 器 总 线 (memory bus) 

在 Intel 公司 早期 推出 的 芯片 组 中 ,在 CPU 和 主 存 之 间 有 一 个 北桥 芯片 组 ,CPU 连接 
到 北桥 芯片 的 总 线 被 称 为 处 理 器 总 线 , 也 称 为 系统 总 线 或 前 端 总 线 ; 北 桥 芯 片 连 到 主 存 的 总 
线 被 称 为 存储 器 总 线 。Core i7 以 后 的 处 理 器 芯片 中 集成 了 原先 北桥 芯片 中 的 功能 迎 辑 , 包 
括 内 存 控制 器 等 ,因而 ,在 这 种 处 理 器 架构 的 系统 中 ,处 理 器 通过 存储 器 总 线 (内 存 条 插 槽 ) 
直接 连接 到 内 存 条 上 。 

1/0 总 线 (1/O bus) 

用 于 各 种 外 设 控制 器 ( 即 IO 接口 ,如 显卡 、 网 卡 等 ) 与 主机 相连 ,通常 是 标准 总 线 ,如 
PCI 总线 .AGP 总 线 .PCLExpress 总 线 等 。 

通信 总 线 (communication bus) 

通信 总 线 用 于 主机 和 1/O 设备 之 间或 计算 机 系统 之 间 的 通信 。 由 于 这 类 连接 涉及 许 
多 方面 ,包括 距离 远近 、 速 度 快慢 、 工 作 方式 等 ,差异 很 大 ,所 以 通信 总 线 的 种 类 很 多 ,如 RS- 
232 串 行 总 线 `.USB 串 行 总 线 .SCSI 总 线 等 。 

底板 总 线 (backplane bus) 

总 线 按 连 线 类 型 可 分 为 电缆 式 ,主板 式 和 底板 式 。 通 常 ,通信 总 线 采 用 电线 式 总 线 ,处 
理 器 总 线 和 存储 器 总 线 采用 主板 式 总 线 , 而 I/O 总 线 采用 底板 式 总 线 。 

底板 式 总 线 在 主板 上 提供 相应 的 扩展 总 线 插 槽 ,各 种 1/O 接口 模块 (如 网 卡 、 显 卡 等 ) 
可 以 1/O 插件 板 卡 的 形式 插入 相应 的 插 槽 ,以 进行 外 部 设备 的 扩展 。 为 使 各 1/O 插件 板 的 
插座 之 间 具 有 通用 性 ,底板 总 线 通常 是 标准 总 线 , 使 得 不 同 厂 家 的 IVO 插件 板 可 以 互 连 、 
互 换 。 
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并 行 传输 (parallel transfer) 

总 线 中 传输 的 数据 在 数据 线 上 同时 有 多 位 一 起 传送 ,每 一 位 要 有 一 根 数据 线 ,因此 由 多 
根 数 据 线 组 成 。 其 特点 是 同时 可 以 传输 多 个 数据 ,但 数据 之 间 必须 同步 ,而 且 因 为 数据 线 
多 ,使 得 相互 间 干 扰 大 ,因而 ,数据 传输 的 速度 受到 很 大 影响 。 

串 行 传输 (serial transfer) 

总 线 中 传输 的 数据 在 数据 线 上 按 位 进行 传输 ,因此 只 需要 一 根 或 两 根 数据 信号 线 ,线路 
的 成 本 低 ,适合 于 远 距 离 或 者 近 距 离 快 速 数据 传输 。 对 于 串 行 传输 的 总 线 ,提高 时 钟 速度 比 
并 行 传输 总 线 容易 得 多 , 且 几 乎 没有 线 间 串扰 。 因 而 串 行 传输 总 线 的 速度 可 以 比 并 行 传输 
总 线 快 得 多 。 

信号 线 复 用 (signal multiplexing) 

信号 线 复 用 指 同一 组 线 在 不 同 的 时 刻 传送 不 同 的 信号 ,例如 ,数据 /地 址 线 复 用 时 ,用 同 
一 组 线 在 总 线 事务 的 地 址 阶段 传送 地 址 信息 ,在 数据 阶段 传送 数据 信息 ,这 样 就 使 得 地 址 和 
数据 通过 同一 组 线 进行 传输 。 

总 线 事务 (bus transaction) 

通常 把 在 总 线 上 一 对 设备 之 间 的 一 次 信息 交换 过 程 称 为 一 个 总 线 事务 。 把 发 出 事务 请 
求 的 部 件 称 为 主 控 设 备 或 主 设备 (master) ,也 称 起 动 者 (initiator) , 另 一 个 部 件 称 为 从 设备 
(slave) ,也 称 目标 (target) 。 总 线 事务 类 型 由 其 操作 性 质 来 定义 。 例 如 ,存储 器 读 事务 是 指 
将 数据 从 主 存 取出 到 处 理 器 ,存储 器 写 事务 是 指 将 数据 写 到 主 存 。 典 型 的 总 线 事务 类 型 有 
存储 器 读 存储 器 写 .I/O 读 .I/O 写 .中 断 响应 等 。 

总 线 传输 周期 (bus transmission cycle) 

在 总 线 上 完成 一 次 总 线 事务 所 用 的 时 间 。 通 常 由 若干 个 总 线 时 钟 周期 组 成 ,简称 为 总 
线 周 期 。 

总 线 宽度 (bus width) 

总 线 中 数据 线 的 条 数 被 称 为 总 线 的 宽度 , 即 总 线 能 同时 传送 的 数据 位 数 , 它 决定 了 每 次 
能 同时 传输 的 数据 信息 的 位 数 。 用 位 表示 时 ,也 称 为 总 线 位 宽 ;用 字 节 表示 时 ,其 值 为 总 线 
位 宽 /8。 

总 线 时 钟 频率 (bus clock frequency) 

总 线 中 用 于 定时 的 公共 时 钟 信号 的 频率 就 是 总 线 的 时 钟 频 率 。 常 以 MHz、GHz 等 为 
单位 。 这 里 M 和 G 都 是 10 的 震 次 。 

总 线 传输 速率 (bus transfer speed) 

单位 时 间 内 传输 数据 的 次 数 ,也 称 为 总 线 工 作 频 率 , 常 以 MT/s、GT/s 等 为 单位 ,分 别 
表示 每 秒 传输 多 少 M 次 或 多 少 G 次 数据 。 也 有 人 会 用 MHz、GHz 来 作为 总 线 工作 频率 。 
早期 的 总 线 通常 一 个 时 钟 周期 传送 一 次 数据 ,因此 ,总 线 工作 频率 等 于 总 线 时钟 频 率 。 现 在 
有 些 总 线 一 个 时 钟 周期 可 以 传送 2 次 或 4 次 数据 ,因此 ,总 线 工 作 频 率 是 总 线 时 钟 频率 的 
2 倍 或 4 倍 。 

总 线 带 宽 (bus bandwidth) 

总 线 带宽 就 是 总 线 的 最 大 数据 传输 率 , 即 总 线 在 进行 数据 传输 时 单位 时 间 内 在 总 线 上 
可 传输 的 最 大 数据 量 。 它 与 总 线 宽度 ,总线 工作 频率 等 有 关 。 用 公式 表示 为 B=WXF/N 
( 式 中 了 3 为 总 线 带宽 , 克 为 总 线 宽度 ,下 为 总 线 时 钟 频率 ,NN 为 传输 一 个 数据 所 用 的 总 线 时 
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钟 周期 数 ,因此 F/N 实际 上 为 总 线 工作 频率 )。 

突 发 传送 方式 (burst transmission) 

是 一 种 连续 的 成 批 数据 传送 方式 。 只 需 在 传送 开始 时 给 出 数据 块 的 首 地 址 ,然后 连续 
传送 多 个 数据 ,后 续 数 据 的 地 址 默认 为 前 面 数 据 地 址 加 1 ,实际 上 这 些 连 续 的 数据 一 般 在 存 
储 阵列 的 同一 行 上 。 在 主 存储 器 中 有 一 个 行 缓冲 (row buffer) ,在 突 发 传送 事务 中 ,每 次 访 
问 第 一 个 数据 时 ,都 会 读 出 一 行 数 据 到 行 缓冲 ,后 面 的 连续 数据 就 只 要 从 行 缓冲 中 源源 不 断 
地 取出 即 可 。 所 以 ,这 种 方式 下 ,总 线 上 能 够 实现 一 个 时 钟 周期 内 传送 多 个 数据 。 在 总 线 宽 
度 和 工作 频率 相同 的 情况 下 ,数据 传输 率 大 大 高 于 不 支持 突 发 传送 的 总 线 。 这 种 方式 也 称 
为 背 对 背 (back-to-back) 传 送 方式 。 

总 线 裁决 (bus arbitration) 

决定 哪个 总 线 主 控 设 备 将 在 下 次 得 到 总 线 使 用 权 的 过 程 被 称 为 总 线 裁决 。 进 行 总 线 裁 
决 有 多 种 方案 ,主要 分 为 集中 式 和 分 布 式 两 大 类 。 

总 线 裁决 器 (bus arbiter) 

总 线 裁决 器 也 叫 总 线 控制 器 , 当 多 个 设备 同时 请 求 使 用 总 线 时 ,需要 通过 总 线 裁决 器 决 
定 由 哪个 设备 控制 总 线 。 

总 线 请 求 信号 (bus request signal) 

在 总 线 上 传输 的 一 种 控制 信号 ,设备 要 求 使 用 总 线 时 发 出 ,用 于 表明 发 出 该 请 求 信号 的 
设备 需要 使 用 总 线 。 

总 线 响应 /总 线 允 许 信 号 (bus acknowledge/bus grant signal) 

在 总 线 上 传输 的 一 种 控制 信号 ,总 线 控制 器 在 接收 到 设备 的 总 线 请 求 后 ,根据 优先 级 选 
择 向 一 个 设备 发 送 总 线 响 应 信号 ,表示 允许 该 设备 在 下 个 总 线 周期 使 用 总 线 。 

集中 裁决 (centralized arbitration) 

集中 裁决 方式 将 总 线 控制 逻辑 做 在 一 个 专门 的 总 线 控制 器 或 总 线 裁决 器 中 ,通过 将 所 
有 的 总 线 请 求 集中 起 来 利用 一 个 特定 的 裁决 算法 进行 裁决 。 

分 布 裁决 (distributed arbitration) 

分 布 裁决 方式 没有 专门 的 总 线 控制 器 ,其 控制 逻辑 分 散在 各 个 总 线 部 件 或 设备 中 。 

同步 总 线 (synchronous bus) 

各 部 件 采 用 时 钟 信号 进行 同步 ,协议 简单 ,因而 速度 快 ,接口 逻辑 很 少 。 但 总 线 上 的 每 
个 部 件 必须 在 规定 的 时 间 内 完成 要 求 的 动作 ,因此 一 般 按 最 慢 的 部 件 来 设计 公共 时 钟 。 

异步 总 线 (asynchronous bus) 

为 了 协调 异步 总 线 在 发 送 和 接收 者 之 间 的 数据 传送 ,异步 总 线 使 用 一 种 握手 协议 (应 答 
信号 ) 进 行 通信 。 人 允许 各 设备 之 间 的 速度 有 和 较 大 的 差异 ,所 以 异步 总 线 大 多 用 于 具有 不 同 存 
取 速 度 的 设备 之 间 进 行 通信 。 通 常 ,异步 方式 被 通信 总 线 采 用 。 

握手 信号 (handshaking signal) 

握手 协议 由 一 系列 步骤 组 成 ,在 每 一 步 中 ,只 有 当 双 方 都 同意 时 ,发 送 者 或 接收 者 才 会 
进入 到 下 一 步 ,协议 是 通过 一 组 附加 的 控制 线 来 实现 的 。 握 手 协议 中 的 信号 被 称 为 握手 信 
号 或 应 答 信号 。 

半 同 步 总 线 (semi-synchronous bus) 

半 同 步 通信 总 线 既 保 留 了 同步 通信 的 特点 ,又 能 采用 异步 应 答 方 式 连接 速度 相差 较 大 
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的 设备 。 通 过 在 异步 总 线 中 引入 时 钟 信号 ,其 就 绪 和 完成 等 应 答 信号 都 在 时 钟 的 上 升 沿 或 
下 降 沿 被 采样 ,因而 不 受 其 他 时 间 信 号 的 干扰 。 底 板式 的 I/O 总 线 大 多 采用 半 同 步 方式 。 

分 离 事 务 协议 (split transaction protocol) 

将 一 个 事务 过 程 分 成 两 个 子 过 程 ,在 第 一 个 子 过 程 中 , 主 控 设备 A 在 获得 总 线 使 用 权 
后 ,将 请 求 的 事务 类 型 (总 线 命令 ) ,地 址 以 及 其 他 有 关 信 息 ( 如 标识 主 控 设 备 身份 的 编号 等 ) 
发 送 到 总 线 上 ,从 设备 B 记录 下 这 些 信息 。 主 控 设备 发 完 这 些 信 息 后 便 立 即 释放 总 线 ,这 
样 其 他 设备 便 可 使 用 总 线 ;在 第 二 个 子 过 程 中 ,从 设备 B 收 到 主 控 设 备 A 发 来 的 信息 后 ,就 
按照 其 请 求 的 命令 进行 相应 的 操作 , 当 准备 好 主 控 设备 所 需 的 数据 后 ,从 设备 B 便 请 求 使 
用 总 线 , 一 旦 获得 使 用 权 , 则 从 设备 B 就 将 主 控 设 备 A 的 编号 及 所 需 的 数据 等 送 到 总 线 上 ， 
这 样 主 控 设备 A 便 可 接收 数据 。 这 种 事务 分 离 方式 的 优点 是 : 通过 在 不 传送 数据 期 间 释 放 
总 线 , 使 得 其 他 申请 者 能 使 用 总 线 。 但 是 这 种 方式 的 控制 相当 复杂 ,开销 也 大 ,并 且 事 务 响 
应 时 间 也 会 变 长 。 

即 插 即 用 (plug and Play) 

即 插 即 用 功能 是 指 任何 扩展 卡 只 要 插入 系统 的 插座 上 就 能 工作 。 这 种 技术 通过 自动 配 
置 计算 机 中 的 板 卡 和 其 他 设备 ,将 物理 设备 和 软件 (设备 驱动 程序 ) 相 配合 ,并 在 每 个 设备 和 
它 的 驱动 设备 之 间 建 立 通 信 信 道 。 

1/0 接口 (1/O interface,I/O module) 

1/O 接口 (IO 模块 ) 是 主机 和 外 设 之 间 传 送信 息 的 “桥梁 ”, 介 于 主机 和 外 设 之 间 。 主 
机 控制 外 设 的 命令 信息 ,传送 给 外 设 的 数据 或 从 外 设 取 来 的 数据 以 及 外 设 送 给 主机 的 状态 
信息 等 都 要 先 存放 到 1/O 接口 。 对 每 种 具体 的 设备 来 说 ,就 是 介 于 底板 总 线 和 通信 总 线 
(电缆 式 总 线 ) 之 间 的 扩展 卡 或 插件 板 , 例 如 网 卡 、 显 示 卡 等 。 也 有 很 多 设备 的 接口 电路 集成 
在 主板 上 ,如 声卡 .Modem 卡 、 打 印 机 控制 卡 、 磁 盘 控制 器 ,键盘 /鼠标 控制 电路 等 已 经 基本 
上 集成 在 主板 上 ,只 留 一 些 电缆 插座 ,以 连接 相应 的 外 部 设备 。 

1/0 控制 器 (1/O controller) 

I/O 接口 中 的 控制 电路 ,不 包含 1/O 接口 中 的 连接 器 插座 。 

1/0 端口 (MO port) 

I/O 接口 中 一 些 可 被 程序 访问 的 寄存 器 ,用 来 存放 控制 (命令 ) 数据 和 状态 等 信息 ,这 
些 寄 存 器 被 称 为 1O 端口 。 

命令 (控制 ) 端 口 (command/control port) 

在 1/O 接口 中 ,用 来 存放 CPU 送 来 的 控制 信息 的 寄存 器 称 为 命令 端口 或 控制 端口 ,只 
可 以 对 其 进行 写 操作 。 

数据 端口 (data port) 

在 1/0 接口 中 ,用 于 存放 接收 和 发 送 数据 的 寄存 器 称 为 数据 端口 ,可 以 对 其 进行 读 或 
写 操作 。 

状态 端口 (status port) 

在 I/O 接口 中 ,用 来 记录 外 部 设备 或 1/O 接口 的 状态 的 寄存 器 称 为 状态 端口 ,通常 只 
可 以 对 其 进行 读 操作 。 有 些 接口 电路 将 命令 端口 和 状态 端口 合 二 为 一 ,作为 命令 端口 时 ,从 
CPU 写 和 控制 信息 ;作为 状态 端口 时 , 存 人 外 设 或 接口 的 状态 信息 , 供 CPU 读 取 。 
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1/0 地 址 空间 (1/O address space) 

所 有 I/O 端口 号 组 成 的 地 址 空间 ,也 简称 为 I/O 空间 。 

独立 编 址 (special address space) 

将 1/O 端口 和 主 存单 元 分 别 编号 ,不 占用 主 存单 元 的 地 址 空间 ,因而 主 存单 元 和 I/O 
端口 可 能 会 有 相同 的 编号 ,但 地 址 位 数 大 多 不 同 , 主 存单 元 多 ,地 址 空间 大 ,因而 地 址 位 数 
多 ;1/0 端口 少 ,地 址 空间 小 ,因而 地 址 位 数 少 。 因 为 可 能 有 相同 的 编号 ,指令 中 无 法 靠 地 址 
来 区 分 要 访问 的 是 主 存单 元 还 是 1/O 端口 ,所 以 ,需要 有 和 访 存 指令 不 同 的 操作 码 , 因 此 ， 
需要 设计 专门 的 1/0 指令 。 

统一 编 址 (united address space) 

1/O 端口 和 主 存单 元 统一 编 址 ,所 以 也 称 为 存储 器 映射 /OC(memory-mapped 1/0) 方 
式 。 一 个 地 址 空间 分 成 了 两 部 分 ,各 在 不 同 的 地 址 段 中 ,但 地 址 的 位 数 是 相同 的 ,可 根据 地 
址 范围 的 不 同 来 区 分 访问 的 是 主 存单 元 还 是 I/O 端口 ,所 以 无 需 专 门 的 输入 输出 指令 。 

并 行 接口 (parallel interface) 

并 行 接口 在 设备 和 接口 之 间 同 时 传送 一 个 字 节 或 一 个 字 的 所 有 位 的 I/O 接口 。 

串 行 接口 (serial interface) 

在 设备 和 接口 之 间 按 位 传送 数据 的 I/O 接口 。 

可 编程 接口 (programmable interface) 

能 用 程序 来 改变 或 选择 功能 和 操作 方式 的 接口 。 

不 可 编程 接口 (non-programmable interface) 

不 能 用 程序 来 改变 其 功能 和 操作 方式 ,但 可 通过 硬 连 线路 来 实现 不 同 的 功能 的 I/O 
接口 。 

1/0 指令 (1/O instruction) 

指 用 来 访问 1/O 端口 的 指令 。 指 令 中 的 操作 码 必须 指出 是 读 还 是 写 , 地 址 码 必须 说 明 
信息 在 哪个 端口 和 哪个 通用 寄存 器 之 间 进行 传送 ,所 以 ,地 址 码 中 要 给 出 端口 号 和 通用 寄存 
器 编号 ,如 80x86 中 的 IN 指令 和 OUT 指令 等 。 

程序 查询 1/0 方式 (1/O polling) 

CPU 通过 执行 查询 程序 来 完成 对 外 设 的 控制 ,实现 和 外 设 的 数据 传送 。 在 查询 程序 
中 ,CPU 首先 通过 读 取 状态 端口 中 的 状态 信息 ,了 解 接口 是 否 已 “就 绪 ”( 或 “完成 ”) ,若是 ， 
就 通过 数据 端口 进行 新 的 数据 传送 ,并 查询 外 设 是 否 空闲 ,在 外 设 空闲 的 情况 下 ,通过 发 送 
控制 信息 到 命令 端口 ,然后 由 接口 发 "启动 ”命令 送 外 设 ; 如 果 接 口 没 有 就 绪 ,或 外 设 不 空闲 ， 
则 CPU 继续 查询 ,以 等 待 接口 就 绪 或 外 设 空闲 。 所 有 信息 (包括 控制 .数据 ,状态 ) 的 交换 
由 查询 程序 中 的 1/O 指令 完成 。 

就 绪 状态 (ready) 

对 于 输入 设备 而 言 ,就 绪 状 态 意味 着 I/O 接口 中 的 数据 缓冲 器 已 准备 好 ,CPU 可 以 从 
I/O 接口 取 数 据 ; 对 于 输出 设备 而 言 , 则 说 明 1/O 接口 中 的 数据 缓冲 器 已 空 ,CPU 可 以 将 数 
据 送 到 I/O 接口 中 。 

程序 中 断 1/0 方式 (I/O interrupt) 

程序 中 断 1/O 方式 下 ,CPU 启动 外 设 后 ,就 转 到 另外 一 个 程序 执行 ,此 时 ,外 设 和 CPU 
并 行 工作 。 一 旦 外 设 完成 任务 , 便 发 中 断 请 求 给 CPU ,告知 CPU 上 次 任务 已 经 完成 。 此 
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时 ,CPU 暂停 正在 执行 的 程序 , 转 到 一 个 中 断 服务 程序 进行 中 断 处理 , 在 中 断 处 理 过 程 中 ， 
进行 外 设 下 一 步 的 准备 工作 (例如 ,传送 下 一 个 要 打印 的 数据 ,或 者 取 走 键盘 数据 或 采样 数 
据 , 为 下 次 输入 腾空 数据 缓冲 寄存 器 ,等 等 ) ,最 后 启动 外 设 ,并 回 到 原 程序 继续 执行 。 此 时 ， 
CPU 和 外 设 又 能 并 行 工作 。 

可 屏蔽 中 断 (maskable interrupt) 

如 果 某 个 中 断 事件 不 是 很 紧急 ,可 以 被 延缓 响应 ,那么 在 处 理 其 他 中 断 时 ,就 可 以 屏蔽 
这 个 中 断 , 让 正在 处 理 的 中 断 执行 完 ,再 来 响应 这 个 中 断 。 这 种 中 断 称 为 可 屏蔽 中 断 。 一 般 
外 设 中 断 源 引 起 的 中 断 都 是 可 屏蔽 中 断 。 

不 可 屏蔽 中 断 (Non-Maskable Interrupt, NMI) 

不 可 屏蔽 中 断 是 指 重要 或 紧急 的 硬件 故障 事件 ,如 电源 掉 电 、 存 储 器 线路 错 等 。 这 类 中 
断 发 生 时 ,必须 立即 响应 ,不 能 把 这 类 中 断 屏蔽 掉 。 

中 断 请 求 寄存 器 (interrupt request register) 

中 断 控制 器 中 专门 用 来 存放 每 个 设备 对 应 的 中 断 请 求 信号 的 寄存 器 。 

中 断 屏蔽 寄存 器 (interrupt mask register) 

中 断 控制 器 中 专门 用 来 存放 每 个 中 断 源 对 应 的 中 断 屏 蔽 字 的 寄存 器 。 

向 量 中 断 (vector interrupt) 

是 指 一 种 识别 中 断 源 的 技术 或 方式 。 识 别 中 断 源 的 目的 就 是 要 找到 中 断 源 对 应 的 中 断 
服务 程序 的 入口 地 址 , 即 获得 向 量 地 址 。 采 用 向 量 中 断 进行 中 断 源 识 别 的 做 法 是 ,采用 某 种 
硬件 排队 线路 (如 菊花 链 ,并行 判 优等 ) ,对 所 有 未 被 屏蔽 的 中 断 请 求 进行 排队 , 选 出 优先 级 
最 高 的 中 断 源 ,然后 对 其 编码 ,得 到 该 中 断 源 的 编号 (有 些 书 中 称 其 为 向 量 地 址 ) ,通过 总 线 
将 其 取 到 CPU 中 ,转换 成 向 量 地 址 ,从 而 取出 中 断 服务 程序 人 口 地 址 ,或 跳 转 到 中 断 服 务 
程序 。 还 有 一 种 中 断 源 识 别 方式 是 用 程序 ( 称 为 中 断 查 询 程序 ) 进 行 识别 的 软件 方法 。 

中 断 向 量 (interrupt vector) 

每 个 中 断 源 都 有 对 应 的 处 理 程序 , 称 这 个 处 理 程序 为 中 断 服务 程序 ,其 入 口 地 址 称 为 中 
断 向 量 。 

中 断 向 量 表 (interrupt vector table) 

所 有 中 断 ( 包 括 异 常 ) 的 中 断 服务 程序 入 口 地 址 构成 一 个 表 , 称 为 中 断 向 量 表 ; 也 有 的 机 
器 把 中 断 服务 程序 人 口 的 跳 转 指令 构成 一 张 表 , 称 为 中 断 向 量 跳 转 表 。 

向 量 地 址 (vector address) 

中 断 向 量 表 或 中 断 向 量 跳 转 表 中 每 个 表 项 所 在 的 内 存 地 址 称 为 向 量 地 址 。 

中 断 类 型 号 (interrupt number) 

中 断 向 量 表 或 中 断 向 量 跳 转 表 中 每 个 表 项 所 在 的 表 项 索引 值 , 称 为 中 断 类 型 号 。 

中 断 响应 优先 级 (interrupt response priority) 

中 断 响 应 优先 级 是 指 当 多 个 中 断 请 求 发 生 时 优先 响应 哪个 中 断 请 求 。 它 是 由 硬件 排队 
线路 或 中 断 查询 程序 的 查询 顺序 决定 的 ,不 可 动态 改变 。 

中 断 处 理 优先 级 (interrupt process priority) 

中 断 处 理 优先 级 反映 的 是 正在 处 理 的 中 断 是 否 比 新 发 生 的 中 断 的 处 理 优 先 级 低 ( 即 屏 
项 位 为 0, 对 新 中 断 开 放 ) ,如 果 是 ,就 中 止 正在 处 理 的 中 断 , 转 到 新 中 断 服务 程序 去 执行 ,处 
理 完 后 回 到 原 被 中 止 的 中 断 服务 程序 继续 执行 。 中 断 处 理 优先 级 可 以 由 中 断 屏蔽 字 来 动态 
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中 断 响应 (interrupt response) 

是 指 CPU 发 现 有 中 断 请 求 到 取出 中 断 服务 程序 的 入 口 地 址 准备 执行 中 断 服务 程序 的 
过 程 。CPU 总 是 在 一 条 指令 执行 完 、 取 下 条 指令 之 前 去 查询 有 无 中 断 请 求 。 如 果 此 时 是 开 
中 断 状 态 ,并 有 未 被 屏蔽 的 中 断 请求 发 生 , 则 CPU 自动 执行 一 条 隐 指 令 , 进 入 中 断 响应 周 
期 ,以 完成 关中 断 .保护 断 点 、. 取 中 断 向 量 三 个 操作 。 

中 断 服务 程序 (interrupt handler) 

也 称 为 中 断 处 理 程序 .异常 处 理 程序 等 。 当 CPU 发 现 中 断 或 异常 时 ,就 会 把 当前 正在 
执行 的 用 户 程序 停 下 来 , 调 出 处 理 异 常 或 中 断 的 程序 来 执行 ,这 个 程序 就 是 中 断 服务 程序 。 
中 断 服务 程序 属于 操作 系统 内 核 部 分 ,所 以 ,发 生 中 断 或 异常 时 ,CPU 的 状态 要 从 用 户 态 
( 即 执行 用 户 程序 的 状态 ,也 称 为 目 态 ) 切 换 到 管理 态 ( 即 执行 操作 系统 管理 程序 ,也 称 为 
管 态 ) 。 

DMA LI/O 方式 

DMA 是 Direct Memory Access( 直 接 存储 器 存 取 ) 的 缩写 。 每 次 需要 进行 外 设 数据 读 
写 时 ,首先 CPU 把 要 传送 的 数据 个 数 数据 块 在 内 存 的 首 址 ,数据 传送 的 方向 (是 读 操作 还 
是 写 操作 ) ,设备 的 地 址 等 参数 送 给 DMA 控制 器 ,然后 发 送 一 个 命令 给 DMA 接口 ,启动 外 
设 进行 数据 准备 工作 。 在 这 些 工作 完成 后 ,CPU 就 继续 进行 其 他 工作 。 此 时 ,外 设 和 CPU 
并 行 工作 。 而 IO 设备 和 主 存 交 换 数 据 的 事情 就 交 给 了 DMA 控制 器 。DMA 控制 器 在 需 
要 的 时 候 申请 总 线 控制 权 , 占 用 总 线 完成 I/O 设备 和 主 存 间 的 数据 传送 。 传 送 结束 后 ,向 
CPU 发 送 *DMA 结束 ?中断 请 求 , 让 CPU 进行 数据 校 验 等 后 处 理工 作 。 

DMA 方式 适合 于 像 磁盘 一 类 的 高 速 设备 (外 存 ) ,以 成 批 的 方式 和 内 存 直接 交换 数据 。 

周期 挪用 (cycle stealing) 

周期 挪用 法 的 基本 思想 是 , 当 外 设 准备 好 一 个 数据 时 ,DMA 控制 器 就 向 CPU 申请 一 
次 总 线 控制 权 , CPU 在 一 次 总 线 操 作 结束 时 一 旦 发 现 有 DMA 请 求 ,就 立即 释放 和 总线, 让 出 
一 个 周期 给 DMA 控制 器 ,由 DMA 控制 器 控制 总 线 在 主 存 和 外 设 之 间 传 送 一 个 数据 ,传送 
结束 后 立即 释放 总 线 , 下 次 外 设 准 备 好 数据 时 ,又 重复 上 述 过 程 ,直到 所 有 数据 传送 完毕 。 
这 种 情况 下 ,CPU 的 工作 几乎 不 受 影响 ,只 是 在 万 一 出 现 访 存 冲 突 ( 即 CPU 和 DMA 控制 
器 同时 要 求 访问 同一 个 主 存 ) 时 ,CPU 挪 出 一 个 周期 给 DMA ,由 DMA 访问 主 存 ,而 CPU 
延迟 访问 主 存 。 这 里 CPU 挪用 的 是 主 存 存 取 周期 。 

DMA 控制 器 (DMA controller) 

把 DMA 接口 中 控制 数据 传送 的 硬件 逻辑 称 为 DMA 控制 器 。 它 能 像 CPU 一 样 控 制 
总 线 , 完 成 I/O 设备 和 主 存 间 的 数据 传送 。 


8.4 常见 问题 解答 


1. 机 器 字 长 . 编 址 单位 , 存 取 单 位 、 传 输 单位 ,指令 字 长 各 指 什么 ”它们 之 间 有 何 关系 ? 
答 : 在 计算 机 内 部 ,有 指令 和 数据 两 大 类 信息 。 指 令 和 数据 都 以 二 进 制 形式 存放 在 存 
储 器 中 ,运行 程序 时 ,需要 把 指令 和 数据 从 存储 器 读 出 ,通过 总 线 传输 到 CPU ,然后 ,CPU 
再 通过 执行 指令 来 对 操作 数 进行 相应 的 运算 ,最 后 把 结果 数据 送 到 寄存 器 或 存储 器 中 。 所 
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以 ,在 设计 或 使 用 计算 机 过 程 中 ,要 涉及 很 多 问题 ,例如 ,指令 和 数据 在 存储 器 中 按 什么 长 度 
存放 ; 写 人 或 读 出 时 按 什么 长 度 存 取 ; 在 总 线 上 传输 时 同时 传送 多 少 位 ;数据 和 指令 送 到 
CPU 后 ,在 CPU 的 寄存 器 中 按 多 少 位 存放 ;在 运算 器 中 按 多 少 位 来 运算 ,等 等 。 因 而 ,出 现 
了 一 系列 有 关 信 息 单位 和 信息 宽度 的 概念 ,这 些 概 念 非常 重要 ,但 比较 容易 混淆 ,需要 将 很 
多 知识 和 概念 联系 在 一 起 ,才能 很 好 地 理解 这 些 概念 及 其 相互 之 间 的 关系 。 

它们 的 定义 和 关系 说 明 如 下 。 

(1) 机 器 字 长 是 计算 机 的 一 个 非常 重要 的 指标 。 通 常 称 32 位 机 器 或 64 位 机 器 ,就 是 
指 机 器 的 字 长 是 32 位 或 64 位。 一般 情况 下 ,机 器 字 长 定义 为 CPU 中 在 同一 时 间 内 一 次 能 
够 处 理 的 二 进 制 数 的 位 数 ,实际 上 就 是 CPU 中 定点 运算 数据 通路 的 位 数 。 在 计算 机 中 ， 
“ 字 ” 的 概念 经 常 出 现 。 一 个 字 的 宽度 并 不 等 于 机 器 字 长 。 字 作为 机 器 中 所 有 信息 宽度 的 计 
量 单位 ,对 于 某 个 系列 机 来 说 ,其 字 宽 总 是 固定 的 。 例 如 ,在 80x86 系列 中 ,一 个 字 的 宽度 为 
16 位 ,因此 ,32 位 是 双 字 ,64 位 是 四 字 。 在 IBM 303X 系列 中 ,一 个 字 的 宽度 为 32 位 ,所 以 
16 位 为 半 字 ,32 位 为 单字 ,64 位 为 双 字 。 

(2) 编 址 单位 就 是 存储 单元 的 宽度 , 指 存储 器 中 具有 相同 地 址 的 若干 个 存储 元 件 ( 或 称 
存储 元 ,存储 基 元 .记忆 单元 ) 构 成 的 一 个 二 进 制 代 码 的 宽度 ,可 以 是 8 位 16 位 .32 位 等 。 
现在 大 多 数 计算 机 按 字 节 编 址 , 即 编 址 单位 为 8 位 ,每 一 个 字 节 有 一 个 地 址 。 由 此 可 见 , 一 
个 数据 (如 32 位 整数 32 位 浮 点 数 或 64 位 浮 点 数 等 ) 可 能 占 多 个 存储 单元 ,CPU 要 求 一 次 
从 存储 器 读 出 或 写 入 的 信息 也 可 能 有 多 个 存储 单元 。 

(3) 存 取 宽度 是 指 一 次 从 一 个 由 多 个 DRAM 芯片 构成 的 存储 模块 中 同时 读 写 的 信息 
的 宽度 ,例如 ,假定 某 个 存储 模块 由 8 个 4096X4096X8 位 的 DRAM 芯片 按 交 叉 编 址 方式 
构成 , 则 该 存储 模块 的 存 取 宽 度 是 64 位 ,也 即 ,8 个 芯片 可 同时 读 写 ,每 个 芯片 同时 读 8 位 ， 
因而 最 多 可 以 同时 存 取 64 位 信息 。 

(4) 传输 宽度 就 是 总 线 宽 度 ,也 就 是 一 次 最 多 能 在 总 线 上 传输 的 数据 位 数 。 对 于 存储 
器 总 线 来 说 ,总 线 上 传输 的 信息 宽度 应 该 等 于 存储 器 的 存 取 宽 度 。 因 此 ,在 设计 系统 时 ,应 
考虑 传输 宽度 和 存 取 宽度 的 匹配 ,并 且 每 个 设备 中 的 总 线 接口 部 件 也 要 与 这 些 宽度 匹配 。 

(5) 指令 字 长 是 指 指 令 的 位 数 。 有 定 长 指令 字 机 器 和 不 定 长 指令 字 机 器 。 定 长 指令 字 
机 器 中 所 有 指令 的 位 数 是 相同 的 ,目前 定 长 指令 字 大 多 是 32 位 指令 字 。 不 定 长 指令 字 机 器 
的 指令 有 长 有 短 , 但 每 条 指令 的 长 度 一 般 都 是 8 的 倍数 。 因 此 ,一 个 指令 字 在 存储 器 中 存放 
时 ,可 能 占用 多 个 存储 单元 ;从 存储 器 读 出 并 通过 总 线 传输 时 ,可 能 分 多 次 进行 ,也 可 能 一 次 
读 多 条 指令 。 

2. 1/0 设备 和 1/0 接口 两 部 分 结合 起 来 就 是 输入 输出 系统 吗 ? 

答 : 不 是 。1/O 设备 和 I/O 接口 只 是 1/0 硬件 部 分 ,输入 输出 系统 应 该 包括 1/O 硬件 
和 I/O 软件 两 个 部 分 。 不 同 硬件 结构 的 1/O 系统 所 采用 的 1/O 软件 技术 差别 很 大 。 但 不 
管 是 哪 种 ,CPU 通过 直接 执行 1/O 指令 或 操作 系统 管理 程序 ,总 是 或 多 或 少 地 参与 主机 和 
外 设 交 换 信 息 的 任务 ,也 就 是 说 ,输入 输出 任务 总 要 有 I/O 软件 的 参与 。 

3. 1/0 系统 的 性 能 如 何 评价 ? 

答 : 一 般 用 响应 时 间 和 吞吐 率 两 个 指标 来 衡量 。 不 同 的 I/O 系统 对 于 响应 时 间 和 吞吐 
率 的 要 求 不 同 。 例 如 ,对 于 事务 处 理 系 统 ( 如 订 票 . 存 /取款 等 系统 ) ,由 于 同时 会 有 大 量 的 事 
务 要 求 处 理 , 且 每 个 事务 对 磁盘 的 访问 量 很 少 ,所 以 这 种 系统 主要 考虑 每 秒 钟 磁盘 的 存 取 次 
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数 能 否 达到 很 大 ,使 得 同时 有 很 多 事务 在 很 短 的 时 间 内 得 到 快速 响应 。 也 就 是 说 ,对 响应 时 
间 的 要 求 更 高 ,而 不 大 在 乎 吞吐 率 。 但 是 , 像 多 媒体 点 播 系统 ,就 希望 系统 的 吞吐 量 很 大 ,要 
求 单位 时 间 内 能 有 大 量 数据 读 出 ,以 满足 播放 要 求 。 

4. 数据 传输 率 中 的 KK.M、G 等 的 含义 和 主 存 容量 中 的 含义 一 样 吗 ?在 磁盘 容量 中 的 
含义 呢 ? 

答 : 不 一 样 。 在 主 存 容量 中 ,K 表示 2 ,M 表示 2”,G 表示 2”。 但 是 ,在 数据 传输 率 
中 ,因为 数据 传输 速度 和 时 钟 频 率 有 关 , 时 钟 频 率 通 常 以 kHz、MHz、GHz 来 表示 ,所 以 , 传 
输 速率 一 般 用 kB/s、MB/s、GB/s 来 表示 ,这 里 的 k 表 示 10: ,M 表示 10,G 表示 10" 。 在 计 
算 中 ,可 能 会 混淆 使 用 ,因为 ,数据 块 的 大 小 还 是 用 KK 表示 2 ,M 表示 2”,G 表示 2”, 而 传 
输 速率 又 和 数据 块 大 小 有 关 , 这 样 使 得 计算 变 得 很 复杂 ,所 以 ,很 多 场合 下 ,不 区 分 它们 之 间 
的 差别 ,而 是 看 成 一 样 的 来 处 理 。 

磁盘 容量 以 兆 字 节 (MB) 或 吉 字 节 (GB) 为 单位 ,1GB=1024MB=2”B。 但 硬盘 厂商 在 
标 称 硬盘 容量 时 通常 取 1GB=1000MB=10?B, 因 此 在 BIOS 中 或 在 格式 化 硬盘 时 显示 的 容 
量 会 比 厂家 的 标 称 值 小 。 

5. 什么 是 MO 设备 的 数据 速率 ”各 种 外 设 的 数据 速率 相差 很 大 吗 ? 

答 : 是 在 IVO 设备 和 主机 之 间 传 输 数据 时 的 峰值 速率 。 各 种 1/O 设备 的 数据 速率 相差 
很 大 。 有 键盘 .鼠标 这 种 极 慢 速 的 设备 ,大 约 每 秒 10B, 也 有 磁盘 和 网 络 设备 等 这 些 每 秒 能 
达到 几 十 兆 字 节 到 上 百 兆 字 节 的 快速 设备 。 不 同 传输 速率 的 外 设 所 用 的 外 设 接口 不 同 ,在 
主板 上 的 连接 方式 不 同 ,所 用 的 1/0 方式 也 不 同 。 

6. 磁盘 上 信息 是 如 何 组 织 的 ? 磁盘 的 最 小 编 址 单位 是 什么 ? 

答 : 磁盘 表面 被 分 为 许多 同心 圆 ,每 个 同心 圆 被 称 为 一 个 磁道 。 信 息 存储 在 磁道 上 。 
每 个 磁道 被 划分 为 若干 段 ,又 叫 扇 区 。 每 个 扇 区 存放 一 个 记录 块 ,每 个 记录 块 有 相应 的 地 址 
标识 字段 数据 字段 和 校 验 字段 等 。 到 磁盘 上 寻找 数据 时 ,只 要 定位 到 数据 在 哪个 磁头 的 哪 
个 磁道 的 哪个 扇 区 。 所 以 , 扇 区 是 磁盘 的 最 小 编 址 单位 。 

7. 一 个 磁盘 扇 区 的 大 小 总 是 512B 吗 ? 

答 : 不 是 。 以 前 ,一 个 磁盘 扇 区 的 大 小 一 直 都 是 512B。 但 是 ,最 近 几 年 ,硬盘 制造 公司 
正在 从 传统 的 512B 扇 区 迁移 到 更 大 更 高 效 的 4096B 扇 区 ,通常 称 为 4K 扇 区 。 

8. 盘面 号 和 磁头 号 是 一 回 事 吗 ? 

答 : 是 的 。 硬 盘 是 一 个 盘 组 ,由 多 个 盘 片 组 成 ,每 个 盘 片 有 两 个 面 。 每 个 盘面 上 有 一 个 
磁头 ,用 于 对 该 盘面 上 的 信息 进行 读 写 。 所 以 ,磁头 号 就 是 盘面 号 。 

9. 柱 面 号 和 磁道 号 是 一 回 事 吗 ? 

答 : 是 的 。 硬 盘 是 一 个 盘 组 ,由 多 个 盘面 组 成 ,所 有 盘面 上 相同 编号 的 磁道 构成 了 一 个 
圆柱 面 (但 物理 上 这 个 圆柱 面 是 不 存在 的 ) ,有 多 少 磁 道 就 形成 多 少 圆柱 面 ,磁道 号 就 是 圆柱 
面 号 。 

10. 当 一 个 磁道 存 满 后 ,信息 是 在 同一 个 盘面 的 下 一 个 磁道 存放 ,还 是 在 同一 个 柱 面 的 
下 一 个 盘面 存放 ? 

答 : 当 一 个 磁道 存 满 后 ,如 果 信息 是 在 同一 个 盘面 的 下 一 个 磁道 存放 , 则 需要 移动 磁 
头 ,移动 磁头 是 机 械 运动 ,花费 时 间 较 长 , 且 有 机 械 磨损 ;如 果 信 息 在 同一 个 柱 面 的 下 一 个 盘 
面 存放 , 则 不 需 移动 磁头 , 即 ,磁道 号 不 变 ,只 要 给 出 一 个 相 邻 盘面 号 ,通过 译 码 电路 选取 该 
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盘面 的 磁头 就 可 以 读 写 了 ,几乎 没有 延迟 ,也 没有 机 械 运动 。 因 此 ,磁盘 地 址 形式 为 磁道 号 
( 柱 面 号 ) .磁头 号 (盘面 号 )、 扇 区 号 。 

11. 数据 总 线 .地 址 总 线 和 控制 总 线 是 分 开 连 接 在 不 同 设备 上 的 三 种 不 同 的 总 线 吗 ? 

答 : 不 是 。 它 们 只 是 系统 总 线 的 三 个 组 成 部 分 ,而 不 能 分 开 来 单独 连接 设备 。 系 统 总 
线 用 来 连接 计算 机 中 若干 主要 部 件 , 一 般 把 在 这 些 部 件 之 间 传输 的 信息 分 为 数据 ,地 址 和 控 
制 三 类 ,控制 信号 包括 总 线 命令 .定时 信号 (如 时 钟 和 握手 信号 等 ) ,总线 请 求 ,总线 允许 .中 
断 请 求 和 中 断 允 许 等 ,所 以 系统 总 线 相应 地 也 就 分 成 了 三 组 传输 线 : 数据 线 、 地 址 线 和 控制 
线 , 有 时 习惯 地 把 它们 分 别称 为 数据 总 线 、 地 址 总 线 和 控制 总 线 。 

12. 为 什么 要 有 总 线 判 优 控制 ? 

答 : 总 线 是 共享 的 信息 传输 介质 ,早期 可 以 同时 有 很 多 设备 连接 在 同一 个 总 线 上 ,但 每 
一 时 刻 总 线 只 能 完成 一 对 设备 之 间 的 信息 传送 。 当 有 多 个 设备 同时 要 使 用 总 线 传输 信息 
时 ,如 果 允 许 它们 同时 把 自己 的 信息 发 到 总 线 上 ,就 会 造成 混乱 ,因此 引入 了 总 线 判 优 机 制 ， 
能 在 多 个 请 求 使 用 总 线 的 设备 中 选择 一 个 ,让 其 控制 总 线 来 传输 信息 ,其 他 设备 则 需 暂时 等 
待 并 在 以 后 的 判 优 中 逐一 被 选中 。 

13. 一 台 机 器 里 面 只 有 一 个 总 线 吗 ? 

答 : 不 一 定 。 总 线 按 其 所 在 的 位 置 分 为 片 内 总 线 、 系 统 总 线 .通信 和 总线。 系统 总 线 是 指 
在 CPU , 主 存 .IVO 各 大 部 件 之 间 进 行 互 连 的 总 线 。 可 以 把 所 有 大 的 功能 部 件 都 连接 在 一 
个 总 线 上 ,也 可 以 用 几 个 总 线 分 别 连接 不 同 的 设备 。 因 此 ,有 单 总 线 结构 、 双 总 线 结构 ,三 总 
线 结构 等 。 通 常 ,一 台 机 器 里 面 应 该 有 不 同 层次 的 多 个 总 线 存在 。 

14. 一 个 总 线 在 某 一 时 刻 可 以 有 多 对 主 \ 从 设备 进行 通信 吗 ? 

答 : 不 可 以 。 在 某 一 个 总 线 传输 周期 内 ,一 个 总 线 只 能 有 一 个 主 控 设 备 控制 总 线 ,选择 
一 个 从 设备 与 之 进行 通信 ,或 对 所 有 其 他 设备 进行 广播 通信 。 因 此 , 某 一 时 刻 一 个 总 线 不 能 
有 多 对 主 、 从 设备 进行 通信 。 

15. 同步 总 线 和 异步 总 线 的 特点 各 是 什么 ?各 自 适用 于 什么 场合 ? 

答 : 同步 总 线 的 特点 是 各 部 件 采 用 时 钟 信号 进行 同步 ,协议 简单 ,因而 速度 快 ,接口 好 
辑 很 少 。 但 总 线 上 的 每 个 部 件 必 须 在 规定 的 时 间 内 完成 要 求 的 动作 ,所 以 一 般 按 最 慢 的 部 
件 来 设计 公共 时 钟 。 而 且 由 于 时 钟 偏 移 问题 ,同步 总 线 不 能 很 长 。 所 以 ,一 般 同步 总 线 用 在 
部 件 之 间距 离 短 、 存 取 速 度 较 一 致 的 场合 。 通 常 ,CPU 内 部 总 线 、 处 理 器 总 线 等 采用 同步 总 
线 。 近 年 来 , 主 存 逐 步 采用 同步 的 DRAM 芯片 构成 ,因此 存储 器 总 线 也 逐步 采用 同步 

异步 总 线 采用 应 答 方 式 进行 通信 ,允许 各 设备 之 间 的 速度 有 较 大 的 差异 ,因此 ,通常 用 
于 具有 不 同 存 取 速度 的 设备 之 间 进 行 通信 。 通 常 连接 外 设 或 其 他 机 器 的 通信 总 线 采 用 异步 
总 线 。 

16. 同一 个 总 线 不 能 既 采用 同步 方式 又 采用 异步 方式 通信 ,是 吗 ? 

答 : 不 是 的 , 半 同 步 通信 总 线 就 可 以 这 样 。 这 类 总 线 既 保留 了 同步 通信 的 特点 ,又 能 采 
用 异步 应 答 方式 连接 速度 相差 较 大 的 设备 。 通 过 在 异步 总 线 中 引入 时 钟 信号 ,其 就 绪 和 应 
答 等 信号 都 在 时 钟 的 上 升 沿 或 下 降 沿 有 效 , 而 不 受 其 他 时 间 信号 的 干扰 。 通 常 I/O 总 线 采 
用 半 同 步 总 线 。 例 如 ,PCI 总 线 是 一 种 半 同 步 总 线 , 它 的 所 有 事件 在 时 钟 下 降 沿 同步 ,总 线 
设备 在 时 钟 开 始 的 上 升 沿 采 样 总 线 信号 。 
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17. 1/0 接口 就 是 1/0 端口 吗 ? 

答 : 不 是 。I/O 接口 和 I/O 端口 是 两 个 不 同 的 概念 ,但 相互 之 间 有 关联 。I/O 接口 是 
主机 和 外 设 之 间 传 送信 息 的 “桥梁 ”, 介 于 主机 和 外 设 之 间 。 主 机 控制 外 设 的 命令 信息 、 传 送 
给 外 设 的 数据 或 从 外 设 取 来 的 数据 .外 设 送 给 主机 的 状态 信息 等 都 要 先 存放 到 1/O 接口 
中 ,所 以 ,接口 中 有 一 些 寄存 器 ,用 来 存放 这 些 控制 .数据 和 状态 信息 。 我 们 把 1/O 接口 中 
的 这 些 寄存 器 称 为 I/O 端口 。 

18. 1/0 端口 是 如 何 编 址 的 ? 

答 : 一 般 有 两 种 编 址 方式 : 独立 编 址 和 统一 编 址 。 这 里 的 统一 和 独立 不 是 指 各 个 不 同 
接口 之 间 的 统一 和 独立 关系 ,而 是 指 所 有 I/O 端口 号 组 成 的 地 址 空间 ( 称 为 1/0 地 址 空间 ) 
和 所 有 主 存单 元 号 组 成 的 地 址 空间 ( 称 为 主 存 地 址 空间 ) 之 间 的 关系 。 

19. CPU 是 如 何 访问 1/O 端口 的 ? 

答 : 在 1/0 指令 中 给 出 要 访问 的 端口 号 , 当 CPU 执行 1/O 指令 时 ,根据 指令 的 操作 码 
或 地 址 范围 ,得 知 要 访问 的 是 1/O 地 址 空间 ,因而 在 总 线 的 地 址 线 上 送出 端口 号 ,在 总 线 的 
控制 线 上 送出 1/O 读 或 1/O 写 命令 ,被 访问 端口 所 在 的 接口 电路 对 地 址 译 码 后 选中 相应 的 
端口 ,并 从 控制 线 上 取得 读 / 写 命令 ,由 接口 中 的 读 / 写 控制 电路 对 被 访问 端口 进行 读 或 写 
操作 。 

20. 一 个 1/0 接口 只 能 有 一 个 地 址 吗 ? 

答 : 不 是 。 每 个 IO 端口 对 应 唯一 的 一 个 地 址 ,但 一 个 1/O 接口 中 可 能 有 多 个 程序 可 
访问 的 寄存 器 ,也 就 是 有 多 个 1/O 端口 ,所 以 应 该 有 多 个 地 址 。 

21. 程序 查询 方式 下 ,外 设 的 数据 是 直接 和 CPU 交换 的 吗 ? 

答 : 是 的 。 程 序 查询 方式 下 ,整个 输入 输出 过 程 是 通过 CPU 执行 查询 程序 完成 的 ,所 
有 信息 (命令 数据, 状态) 的 交换 具体 由 查询 程序 中 的 1/O 指令 进行 控制 ,因而 外 设 的 数据 
是 直接 和 CPU 交换 的 。 

外 设 的 数据 和 状态 信息 通过 1/O 接口 中 设备 侧 的 电缆 线 ( 通 信息 线 ) 送 到 1/O 接口 中 ， 
连同 接口 本 身 的 状态 信息 一 起 记录 到 相应 的 寄存 器 中 ,CPU 再 通过 执行 输入 指令 (如 
80x86 中 的 IN 指令 ) 从 1/O 端口 中 将 状态 或 数据 取 到 CPU 的 寄存 器 中 。CPU 送 到 外 设 的 
数据 和 命令 字 ,通过 执行 输出 指令 (如 80x86 中 的 OUT 指令 ) 从 CPU 中 的 寄存 器 送 到 相应 
的 WO 端口 中 。 

22. 中 断 方式 下 ,外 设 的 数据 是 直接 和 CPU 交换 的 吗 ? 

答 : 是 的 。 中 断 方式 下 , 当 外 设 完成 任务 (如 打印 完 一 个 字符 ,键盘 有 按键 ) ,或 外 设 发 
生 了 特殊 事件 (如 打印 机 缺 纸 ,过 程控 制 中 温度 太 高 ,采样 定时 到 ) 等 ,外 设 通过 向 CPU 发 
中 断 请 求 ,来 中 止 CPU 正在 执行 的 程序 , 转 到 相应 的 中 断 服务 程序 去 执行 ,处 理 完 后 , 回 到 
原 被 中 止 的 程序 继续 执行 。 通 常 在 CPU 执行 中 断 服务 程序 过 程 中 完成 数据 的 交换 ,如 从 
键盘 缓冲 取 数据 ,向 打印 机 缓冲 发 送 打印 字符 , 取 采 样 数据 等 。 这 些 都 是 通过 CPU 执行 输 
人 输出 指令 来 完成 的 ,因而 ,对 于 采用 中 断 方式 的 输入 输出 过 程 ,外 设 的 数据 是 直接 和 CPU 
交换 的 。 

23. DMA 方式 下 ,外 设 的 数据 是 直接 和 CPU 交换 的 吗 ? 

答 : 不 是 。DMA 方式 适合 于 像 磁盘 一 类 的 高 速 设备 ,这 类 设备 以 成 批 方式 与 主机 交换 
几 百 到 几 千 字 节 数据 ,CPU 不 可 能 放 得 下 那么 多 数据 。 因 此 ,DMA 方式 下 ,设备 直接 和 主 
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存 进行 数据 交换 ,由 专门 的 硬件 (DMA 控制 器 ) 控 制 在 主 存 和 外 设 之 间 进 行 数据 传送 。 

24. 中 断 方式 下 ,外 设 任何 时 候 都 可 以 申请 中 断 并 马上 得 到 响应 吗 ? 

答 : 不 是 。 中 断 方式 下 ,外 设 何 时 发 出 中 断 请 求 是 由 外 设 接口 中 的 中 断 逻 辑 决定 的 ,不 
受 CPU 的 限制 ,但 何 时 响应 中 断 与 CPU 执行 指令 过 程 有 关 。CPU 总 是 在 一 条 指令 执行 
完 、. 取 下 条 指令 之 前 去 查询 有 无 中 断 请 求 。 如 果 此 时 是 开 中 断 状 态 ,并 有 未 被 屏蔽 的 中 断 请 
求 发 生 , 则 CPU 进入 中 断 响应 周期 ,自动 执行 一 条 隐 指 令 ,完成 关中 断 ,保护 断 点 、. 取 中 断 
向 量 三 个 操作 。 因 此 ,不 是 任何 时 候 都 马上 响应 中 断 ,中 断 响应 的 条 件 有 三 个 : DCPU 处 
于 开 中 断 状 态 ( 中 断 允 许 触 发 器 EINT 置 1 状态 ); 加 至 少 有 一 个 未 被 屏蔽 的 中 断 请 求 发 
生 ; @ 一 条 指令 执行 结束 。 

25. 为 什么 在 介绍 CPU 设计 时 要 讲 中 断 的 概念 ,在 介绍 VO 系统 时 又 讲 中 断 的 概念 ? 

答 : 在 CPU 执行 程序 过 程 中 ,有 两 种 情况 会 打 断 程序 的 执行 ,一 种 情况 是 CPU 正在 执 
行 的 指令 出 现 了 异常 或 设置 了 陷阱 ; 另 一 种 情况 是 指令 执行 正常 ,但 外 部 设备 出 现 了 特殊 事 
件 ,要 求 CPU 处 理 。 一 般 把 前 者 称 为 异常 ,后 者 称 为 中 断 (也 有 很 多 系统 或 教科 书 不 分 异 
常 和 中 断 , 全 部 称 为 中 断 ) 。 

在 涉及 CPU 设计 时 ,必须 考虑 在 数据 通路 中 如 何 实现 异常 和 中 断 处 理 , 包 括 : 如 何 设 
置 “ 开 /关中 断 ” 状 态 ,如 何 判断 是 否 发 生 了 异常 和 中 断 ,如 何 识别 是 哪 类 异常 和 中 断 , 怎 样 保 
存 断 点 ,如 何 切换 到 中 断 服务 程序 等 。 因 此 ,在 第 5 章 介 绍 CPU 设计 时 谈 到 了 异常 和 中 断 
的 概念 。 
同时 ,中 断 作为 一 种 IO 方式 ,在 许多 采用 中 断 方式 的 外 设 接 口 电路 中 ,必须 有 相应 的 
中 断 处 理 座 辑 ,因此 ,在 本 章 涉及 1/O 系统 设计 时 ,也 谈 到 了 很 多 有 关中 断 的 概念 。 

26. 为 什么 在 响应 中 断 的 时 候 保存 断 点 ,而 在 处 理 中 断 的 时 候 保存 现场 ? 

答 : 断 点 是 中 断 返 回 到 被 中 断 程 序 继续 执行 处 指令 的 地 址 ( 即 响应 中 断 时 PC 的 值 ), 断 
点 在 中 断 响 应 时 先 被 保存 到 栈 中 ,和 否则 , 当 取 来 中 断 服务 程序 的 首 地 址 送 PC 后 ,原来 作为 
断 点 的 PC 的 值 就 被 破坏 了 ;而 现场 是 被 中 断 的 原 程序 在 断 点 处 各 个 寄存 器 的 值 ,只 要 在 这 
些 寄存 器 再 被 使 用 前 保存 到 栈 中 就 行 了 。 因 为 在 实际 处 理 中 断 事件 过 程 中 可 能 要 用 到 这 些 
寄存 器 ,所 以 在 实际 处 理 之 前 的 准备 阶段 来 保存 现场 (寄存 器 压 栈 ) ,而 在 实际 处 理 后 的 结束 
阶段 再 恢复 现场 (寄存 器 出 栈 ) 。 这 样 就 能 保证 被 中 断 程序 的 现场 不 被 中 断 服务 程序 破坏 。 

27. 单 重 中 断 和 多 重 中 断 的 区 别 是 什么 ? 

答 : 单 重 中 断 情况 下 ,在 中 断 处 理 整个 过 程 中 ,不 允许 响应 新 的 中 断 请 求 , 其 做 法 是 在 
中 断 响 应 开始 时 关中 断 ( 使 中 断 允许 触发 器 置 0) ,而 直到 中 断 处 理 结束 后 才 开 中 断 , 然 后 返 
回 到 原 断 点 处 继续 执行 。 

多 重 中 断 系统 中 ,如 果 在 进行 某 个 中 断 请 求 的 处 理 过 程 中 又 发 生 了 新 的 中 断 请 求 , 则 可 
以 中 止 正在 进行 的 中 断 处 理 , 转 到 新 的 中 断 服务 程序 执行 。 因 此 ,在 中 断 处 理 过 程 中 ,应 该 
开 中 断 , 允 许 响 应 新 的 中 断 请 求 。 其 做 法 是 在 实际 处 理 中 断 事件 前 就 开 中 断 , 而 不 是 像 单 重 
中 断 那样 在 处 理 后 才 开 中 断 。 这 样 保证 在 实际 中 断 处 理 过 程 中 可 以 响应 新 的 中 断 请 求 。 

28. 向 量 中 断 .中 断 向 量 向量 地 址 三 个 概念 是 什么 关系 ? 

答 : 中 断 向 量 : 每 个 中 断 源 都 有 对 应 的 处 理 程序 ,我 们 称 这 个 处 理 程序 为 中 断 服 务 程 
序 , 其 人 口 地 址 称 为 中 断 向 量 。 所 有 中 断 的 中 断 服务 程序 和 人口 地 址 构成 一 个 表 , 称 为 中 断 向 
量 表 ; 也 有 的 机 器 把 中 断 服务 程序 人 口 的 跳 转 指令 构成 一 张 表 , 称 为 中 断 向 量 跳 转 表 。 
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向 量 地 址 : 中 断 向 量 表 或 中 断 向 量 跳 转 表 中 每 个 表 项 所 在 的 主 存 地 址 或 表 项 的 索引 
值 , 称 为 向 量 地 址 或 中 断 类 型 号 。 

向 量 中 断 : 是 指 一 种 识别 中 断 源 的 技术 或 方式 。 识 别 中 断 源 的 目的 就 是 要 找到 中 断 源 
对 应 的 中 断 服 务 程序 的 人 口 地 址 , 即 获得 向 量 地 址 。 采 用 向 量 中 断 进行 中 断 源 识别 的 做 法 
如 下 : 在 中 断 控制 器 中 ,通过 某 种 硬件 排队 线路 (如 菊花 链 、 并 行 判 优等 ), 对 所 有 未 被 屏蔽 
的 中 断 请 求 进行 排队 , 选 出 优先 级 最 高 的 中 断 源 , 然 后 对 其 编码 ,得 到 该 中 断 源 的 编号 (可 以 
转换 为 向 量 地 址 )。 通 过 总 线 将 其 取 到 CPU 中 ,并 转换 成 向 量 地 址 ,从 而 取出 中 断 服务 程 
序 人 口 地 址 ,或 跳 转 到 中 断 服务 程序 。 还 有 一 种 是 用 程序 ( 称 为 中 断 查询 程序 ) 进 行 中 断 源 
识别 的 软件 方法 。 

29. 禁止 中 断 和 屏蔽 中 断 是 同一 个 概念 吗 ? 

答 : 它们 是 两 个 完全 不 相关 的 概念 。 

禁止 中 断 就 是 关中 断 ,即将 中 断 允许 触发 器 置 为 0, 此 时 ,任何 中 断 请 求 都 得 不 到 响应 。 

屏蔽 中 断 是 多 重 中 断 系 统 中 的 一 个 概念 ,是 指 某 个 中 断 正在 被 处 理 的 时 候 , 如 果 有 其 他 
新 的 中 断 请 求 发 生 ,那么 ,通过 设置 中 断 屏蔽 位 ,可 以 确定 是 否 允 许 响 应 新 发 生 的 中 断 。 它 
反映 了 正在 处 理 的 中 断 与 其 他 各 中 断 之 间 的 处 理 优 先 级 顺序 ,所 以 每 个 中 断 都 有 一 个 中 断 
屏蔽 字 , 其 中 的 每 一 位 对 应 一 个 中 断 的 屏蔽 位 。 响 应 某 个 中 断后 ,就 会 把 该 中 断 的 中 断 屏蔽 
字 送 到 中 断 屏 项 字 寄存 器 中 ,在 中 断 排 队 前 ,其 中 的 每 一 位 和 中 断 请 求 寄存 器 中 的 对 应 位 进 
行 “ 与 操作 ,因而 ,只 有 未 被 屏蔽 的 中 断 源 进 入 排队 线路 , 才 有 可 能 得 到 响应 。 

30. 中 断 响应 优先 级 和 中 断 处 理 优先 级 一 样 吗 ? 

答 : 不 一 样 ,这 是 两 个 不 同 的 概念 。 中 断 响 应 优先 级 是 由 硬件 排队 线路 或 中 断 查询 程 
序 的 查询 顺序 决定 的 ,不 可 动态 改变 ;而 中 断 处理 优 先 级 可 以 由 中 断 屏 项 字 来 改变 ,反映 的 
是 正在 处 理 的 中 断 是 否 比 新 发 生 的 中 断 的 处 理 优 先 级 低 , 如 果 是 ,就 中 止 正 在 处 理 的 中 断 ， 
转 到 新 中 断 去 处 理 ,处 理 完 后 回 到 原 被 中 止 的 中 断 继续 处 理 。 

31. DMA 方式 下 ,在 主 存 和 外 设 之 间 有 一 条 物理 通路 直接 相连 吗 ? 

答 : 没有 。 通 常 所 说 的 DMA 方式 下 数据 在 主 存 和 外 设 之 间 直 接 进行 传送 ,其 含义 并 
不 是 说 在 主 存 和 外 设 之 间 建立 一 条 物理 上 的 直接 通路 ,而 是 在 主 存 和 外 设 之 间 通 过 外 设 接 
口 .系统 总 线 以 及 总 线 桥接 部 件 等 连接 ,建立 起 一 个 信息 可 以 互相 通达 的 通路 。“ 直 接 通 路 ” 
是 逻辑 上 的 含义 ,物理 上 磁盘 和 主 存 不 是 直接 相连 的 。 

32. DMA 方式 下 ,CPU 一 点 开销 都 没有 吗 ? 

答 : 不 是 。DMA 方式 下 的 数据 交换 过 程 分 以 下 三 个 步骤 : 

(1) DMA 控制 器 的 初始 化 。 将 所 要 传送 的 数据 个 数 、 内 存 地 址 ,传送 方向 等 送 到 DMA 
控制 器 。 这 个 过 程 由 CPU 执行 指令 来 完成 。 初 始 化 结束 后 ,CPU 发 送 启动 磁盘 定位 和 
DMA 传送 的 命令 ,这 也 是 通过 CPU 执行 输出 指令 来 完成 的 。 

(2) DMA 传送 。 这 个 过 程 整个 都 是 由 硬件 来 完成 的 ,主要 由 DMA 控制 器 控制 系统 总 
线 , 完 成 数据 在 主 存 和 外 设 之 间 的 数据 传送 。 

(3) DMA 传送 结束 处 理 。DMA 传送 结束 后 ,向 CPU 发 出 *DMA 结束 ”中 断 请 求 ,由 
CPU 执行 相应 的 中 断 服务 程序 进行 数据 校 验 等 后 处 理工 作 。 

综 上 所 述 ,DMA 方式 下 ,CPU 要 进行 初始 化 和 后 处 理 两 部 分 工作 ,因此 ,不 是 一 点 开销 
都 没有 。 只 是 相对 于 程序 查询 方式 和 中 断 方式 来 说 ,CPU 介入 要 少 得 多 , CPU 不 需要 介入 
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主要 的 数据 传送 过 程 。 

33. CPU 对 DMA 请 求 和 中 断 请 求 的 响应 时 间 是 否 一 样 ? 

答 : 不 一 样 。 DMA 方式 下 ,向 CPU 请 求 的 是 总 线 控制 权 , 要 求 CPU 让 出 总 线 控制 权 
给 DMA 控制 器 ,由 DMA 控制 器 来 控制 总 线 完成 主 存 和 外 设 之 间 的 数据 交换 ,因此 ,CPU 
只 要 用 完 总 线 后 就 可 以 响应 请 求 ,释放 总 线 , 让 出 总 线 控制 权 。CPU 总 是 在 一 次 总 线 事务 
完成 后 响应 ,因此 ,DMA 响应 时 间 应 该 少 于 一 个 总 线 周 期 ;而 中 断 方式 下 请 求 的 是 CPU 时 
间 , 要 求 CPU 中 止 正在 执行 的 程序 , 转 到 中 断 服务 程序 去 执行 ,通过 执行 中 断 服务 程序 ,对 
中 断 事件 进行 相应 的 处 理 。CPU 总 是 要 等 到 一 条 指令 执行 结束 后 , 才 去 查询 有 无 中 断 请 
求 ,所 以 响应 时 间 少 于 一 个 指令 周期 的 时 间 。 

34. 挪用 周期 方式 下 ,DMA 控制 器 窃取 的 是 什么 周期 ? 

答 : 周期 挪用 法 的 基本 思想 是 , 当 外 设 准备 好 一 个 数据 时 ,DMA 控制 器 就 向 CPU 申请 
一 次 总 线 控制 权 , CPU 在 一 个 总 线 事务 结束 时 ,一 旦 发 现 有 DMA 请求, 就 立即 释放 总 线 ， 
让 出 一 个 周期 给 DMA 控制 器 ,由 DMA 控制 器 控制 总 线 在 主 存 和 外 设 之 间 传 送 一 个 数据 ， 
传送 结束 后 立即 释放 总 线 , 下 次 外 设 准备 好 数据 时 ,又 重复 上 述 过 程 ,直到 所 有 数据 传送 完 
毕 。 这 种 情况 下 ,CPU 的 工作 几乎 不 受 影响 ,只 是 在 万 一 出 现 访 存 冲 突 时 ,CPU 挪 出 一 个 
周期 给 DMA, 由 DMA 访问 主 存 ,而 CPU 延迟 访问 主 存 。 这 里 CPU 挪 出 的 是 主 存 的 存储 
周期 。 

35. 用 户 程序 能 直接 对 外 部 设备 进行 读 写 或 控制 吗 ? 为 什么 

答 : 现代 计算 机 系统 中 ,用 户 程序 不 能 直接 对 外 部 设备 进行 读 写 或 控制 ,只 有 操作 系统 
才能 与 外 部 设备 直接 打交道 ,控制 外 部 设备 完成 具体 的 1/O 操作 。 因 而 ,操作 系统 在 IO 
子 系统 中 承担 极其 重要 的 作用 ,这 主要 是 由 I/O 子 系统 以 下 3 个 特性 决定 的 。 

(1) 共享 性 。I/O 子 系统 被 多 个 进程 共享 ,因此 必须 由 操作 系统 对 共享 的 1/O 资源 统 
一 调度 管理 ,以 保证 用 户 程序 只 能 访问 自己 有 权 访 问 的 那 部 分 1/O 设备 或 文件 ,并 使 系统 
的 吞吐 率 达到 最 佳 。 

(2) 复杂 性 。1/O 设备 控制 的 细节 比较 复杂 ,如 果 由 最 上 层 的 用 户 程序 直接 控制 , 则 会 
给 广大 的 应 用 程序 开发 者 带 来 麻烦 ,因而 需 操 作 系 统 提供 专门 的 驱动 程序 进行 控制 ,这 样 可 
以 对 应 用 程序 员 屏蔽 设备 控制 的 细节 ,简化 应 用 程序 开发 。 

(3) 异步 性 。I/O 子 系统 的 速度 较 慢 ,而 且 不 同 设备 之 间 的 速度 也 相差 较 大 ,因而 ,IO 
设备 与 主机 之 间 的 信息 交换 方式 通常 使 用 异步 的 中 断 IO 方式 ,中 断 导致 从 用 户 态 向 内 核 
态 转移 ,因此 ,1/O 处 理 须 在 内 核 态 完成 ,通常 由 操作 系统 提供 中 断 服务 程序 来 处 理 1/O。 

36. 在 用 户 程序 中 如 何 给 出 1/0 操作 请 求 呢 ? 

答 : 对 于 用 户 程序 ,所 有 高 级 语言 的 运行 时 系统 都 提供 了 执行 1/O 功能 的 高 级 机 制 , 例 
如 ,C 语 言 中 提供 了 像 printf() 和 scanf() 等 这 样 的 标准 I/O 库 函 数 ,C++ 语言 中 提供 了 如 
三 <<( 输 入 ) 和 二 二 (输出 ) 这 样 的 重 载 1/O 操作 符 。 从 用 户 在 高 级 语言 程序 中 通过 1/0 函 
数 或 1/O 操作 符 提 出 1/O 请 求 ,到 1/O 设备 响应 并 完成 1/O 请 求 ,整个 过 程 涉及 多 个 层次 
的 1/0 软件 和 I/O 硬件 的 协调 工作 。 

因为 现代 计算 机 I/O 系统 的 复杂 性 都 隐藏 在 操作 系统 中 ,因此 ,用 户 程序 需要 从 某 个 
设备 输入 信息 或 将 结果 送 到 外 设 时 ,只 要 通过 系统 调用 (以 低级 语言 方式 提供 ) 或 库 函数 调 
用 (以 高 级 语言 方式 提供 ) ,将 1/O 请 求 提交 给 操作 系统 即 可 ,无 须 了 解 外 部 设备 的 具体 工 
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作 细 节 。 

37. 从 用 户 程序 提出 1/O 请 求 到 外 设 完成 1/O 操作 的 大 致 过 程 是 怎样 的 ? 

答 : 用 户 程序 总 是 通过 某 种 1/O 函数 或 I/O 操作 符 请 求 1/O 操作。 例如, 用户 程序 需 
要 读 一 个 磁盘 文件 中 的 记录 时 , 它 可 以 通过 调用 C 语言 标准 1/O 库 函 数 fread() ,也 可 以 直 
接 调 用 read 系统 调用 的 封装 函数 read() 来 提出 1/O 请 求 。 不 管用 户 程序 中 调用 的 是 C 库 
函数 还 是 系统 调用 封装 函数 ,最 终 都 是 通过 操作 系统 内 核 提供 的 系统 调用 来 实现 1/O。 

每 个 系统 调用 的 封装 函数 会 被 转换 为 一 组 与 具体 机 器 架构 相关 的 指令 序列 ,这 个 指令 
序列 中 ,至 少 有 一 条 陷阱 指令 ,在 陷阱 指令 之 前 可 能 还 有 若干 条 传送 指令 用 于 将 1/O 操作 
的 参数 送 入 相应 的 寄存 器 。 

例如 ,在 IA-32 中 ,陷阱 指令 就 是 INT n 指令 ,也 称 为 软 中 断 指令 。 在 早期 IA-32 架构 
中 ,Linux 系统 将 int $0x80 指令 用 作 系 统 调 用 ,在 系统 调用 指令 之 前 会 有 一 串 传送 指令 ， 
用 来 将 系统 调用 号 等 参数 传送 到 相应 的 寄存 器 。 系 统 调用 号 通常 在 EAX 寄存 器 中 ,可 根 
据 系统 调用 号 选择 执行 一 个 系统 调用 服务 例 程 。 用 户 进程 的 1/O 请 求 通 过 调 出 操作 系统 
中 相应 的 系统 调用 服务 例 程 来 实现 。 

I/O 子 系统 工作 的 大 致 过程 如 下 : 首先 ,CPU 在 用 户 态 执行 用 户 进程 , 当 CPU 执行 到 
系统 调用 的 封装 函数 对 应 的 指令 序列 中 的 陷阱 指令 时 ,会 从 用 户 态 陷 人 到 内 核 态 ; 转 到 内 核 
态 执行 后 ,CPU 根据 陷阱 指令 执行 时 EAX 寄存 器 中 的 系统 调用 号 ,选择 执行 一 个 相应 的 系 
统 调用 服务 例 程 ;在 系统 调用 服务 例 程 的 执行 过 程 中 可 能 需要 调用 具体 设备 的 驱动 程序 ;在 
设备 驱动 程序 执行 过 程 中 启动 外 设 工作 ,外 设 准备 好 后 发 出 中 断 请 求 ,CPU 响应 中 断后 ,就 
调 出 中 断 服务 程序 执行 ,在 中 断 服务 程序 中 控制 主机 与 设备 进行 具体 的 数据 交换 。 


8.5 单项 选择 题 


1. 假定 有 一 个 事务 处 理 系统 A, 其 处 理 器 的 速度 为 每 秒 钟 执行 5000 万 条 指令 ,每 个 事 
务 需要 5 次 1/O 操作 ,每 次 1/0 操作 需要 10 000 条 指令 。 如 果 系统 A 每 秒 最 多 发 出 
1000 次 1/O 操作 。 则 它 每 秒 钟 处 理 的 事务 数 最 多 能 达到 (  ) 个 。( 忽 略 延迟 并 假定 事务 
可 以 不 受 限制 地 并 行 处 理 。) 
A. 200 B. 1000 C. 2000 D. 10000 
2. 以 下 各 类 外 设 中 ,属于 成 块 传送 设备 的 是 (。”)。 
A. 键盘 B. 鼠标 器 C. 针 式 打印 机 六 :本 并 
3. 以 下 各 类 外 设 中 ,属于 存储 设备 的 是 (  )。 
A. 键盘 B. 鼠标 器 C. 显示 器 D. 磁盘 存储 器 
4. 以 下 各 类 外 设 中 ,属于 字符 型 设备 的 是 (  )。 
A. 针 式 打印 机 B. 硬盘 存储 器 C. 软驱 D. 光驱 
5, 以 下 是 有 关 非 编码 键盘 和 鼠标 器 的 描述 
@ 键盘 和 鼠标 都 是 字符 型 输入 设备 。 
@ 键盘 和 鼠标 都 以 串 行 方式 和 主机 通信 。 
@ 键盘 和 鼠标 都 采用 中 断 方式 进行 数据 传送 。 
@ 键盘 和 鼠标 向 主机 传送 的 都 是 位 置信 息 。 
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以 上 描述 中 ,正确 的 是 ( ) 


A. D 和 ® B. 四 和 四 和 四 C. OD 和 ® 和 @ D. 全 部 
6. 在 采用 中 断 方式 进行 打印 控制 时 ,在 打印 控制 接口 和 打印 部 件 之 间 交 换 的 信息 不 包 
括 以 下 的 ( 。 )。 
A. 打印 字符 点 阵 信息 B. 打印 控制 信息 
C. 打印 机 状态 信息 D. 中 断 请 求 信 号 


7. 以 下 是 有 关 激 光 打印 机 中 打印 控制 器 功能 的 叙述 ,其 中 错误 的 是 (。”)。 
A. 接受 主机 送 来 的 打印 字符 点 阵 信息 
B. 缓存 主机 送 来 的 各 种 打印 描述 信息 
C. 对 打印 语言 中 描述 的 各 种 命令 进行 解释 
D. 对 打印 内 容 按 页 面 设置 参数 进行 光栅 化 
8. 假定 一 台 计算 机 的 显示 存储 器 用 DRAM 芯片 实现 , 若 要 求 显示 分 辨 率 为 1600X 
1200 ,颜色 深度 为 24 位 , 帧 频 为 85Hz, 显 存 总 带宽 的 50% 用 来 刷新 屏幕 , 则 需要 的 显存 总 
带宽 至 少 约 为 ( ) 
A. 245Mbps B. 979Mbps C. 1958Mbps D. 7834Mbps 
9. 以 下 有 关 磁 盘 驱 动 器 的 叙述 中 ,错误 的 是 (。”)。 
A. 送 到 磁盘 驱动 器 的 盘 地 址 由 磁头 号 .盘面 号 和 扇 区 号 组 成 
B. 能 控制 磁头 移动 到 指定 磁道 ,并 发 回 “ 寻 道 结束 "信号 
C. 能 控制 磁盘 片 转 过 指定 的 扇 区 ,并 发 回 * 扇 区 符合 ”信和 号 
D. 能 对 指定 盘面 的 指定 扇 区 进行 数据 的 读 或 写 操作 
10. 假定 一 个 磁盘 存储 器 有 4 个 盘 片 ,用 于 记录 信息 的 柱 面 数 为 2000, 每 个 磁道 上 有 
3000 个 扇 区 ,每 个 扇 区 512B, 则 该 磁盘 存储 器 的 容量 约 为 (  )。 
A. 12MB B. 24MB GC 2GB D. 24GB 
11. 假定 一 个 磁盘 的 转速 为 7200rpm, 磁 盘 的 平均 寻 道 时 间 为 20ms, 平 均 数据 传输 率 
为 1MB/s, 不 考虑 排队 等 待 时 间 。 那 么 读 一 个 512B 的 扇 区 的 平均 时 间 大 约 为 ( )。 
A. 14.7ms B. 18.8ms C. 24.7ms D. 28.8ms 
12. 假定 计算 机 系统 中 连接 主 存 和 磁盘 的 总 线 带宽 是 68. 8MB/s, 磁 盘 的 最 大 数据 传输 
率 是 5MB/s。 如 果 允 许 磁盘 输入 输出 占用 100% 的 总 线 和 主 存 带宽 ,那么 总 线 上 可 同时 接 
入 的 磁盘 个 数 最 多 是 (。”)。 
A 1 B. 14 Gm D. 16 
13. 以 下 有 关 RAID 技术 的 叙述 中 ,错误 的 是 (  )。 
A. RAID 技术 可 实现 海量 后 备 存储 系统 
B. RAID 技术 可 提高 存储 系统 的 可 靠 性 
C. RAID 中 的 校 验 信息 都 存放 在 一 个 磁盘 上 
D. RAID 通过 多 个 盘 并 行 访 问 来 提高 速度 
14. 系统 总 线 中 控制 线 的 主要 功能 是 (  )。 
A. 提供 定时 信号 ,操作 命令 和 各 种 请 求 /回答 信号 等 
B. 提供 数据 信息 
C. 提供 时 序 信号 
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D. 提供 主 存 和 I/O 模块 的 回答 信号 
15. 假定 一 个 同步 总 线 的 工作 频率 为 33MHz, 总 线 中 有 32 位 数据 线 ,每 个 总 线 时钟 传 
输 一 次 数据 , 则 该 总 线 的 最 大 数据 传输 率 ( 总 线 带 宽 ) 为 (  )。 
A. 66MB/s B. 132MB/s C. 528MB/s D. 1056MB/s 
16. 下 列 有 关 同 步 总 线 事务 的 描述 中 ,错误 的 是 (。”)。 
A. 一 个 总 线 事务 所 用 时 间 由 多 个 总 线 时 钟 周期 组 成 
B. 总 线 事务 开始 时 通常 先 把 地 址 和 读 / 写 命令 送 到 总 线 上 
C.“ 存 储 器 读 "总 线 事务 中 数据 和 地 址 通常 不 会 同时 送 到 总 线 上 
D. 一 次 总 线 事务 只 能 完成 一 个 数据 交换 ,其 位 数 不 超 过 总 线 宽 度 
17. 下 列 有 关 同 步 总 线 的 描述 中 ,错误 的 是 (  )。 
A. 用 一 个 公共 时 钟 信号 进行 同步 
B. 不 需要 应 答 (握手 ) 信 号 
C. 要 求 挂 接 在 总 线 上 的 各 部 件 的 存 取 时 间 较 为 接近 
D. 总 线 长 度 不 受 限制 ,可 以 很 长 
18. 增加 同步 总 线 带 宽 的 手段 有 很 多 ,但 以 下 ( ”) 不 能 提高 总 线 带宽 。 
A. 采用 信号 线 复 用 技术 B. 增加 总 线 宽 度 
C. 采用 突 发 (burst) 传 送 方 式 D. 提高 总 线 时 钟 频 率 
19. 下 列 有 关 存 储 器 总 线 的 叙述 中 ,错误 的 是 (  )。 
A. 采用 并 行 传输 方式 同时 传输 多 位 数据 
B. 总 线 中 有 地 址 .数据 和 控制 三 组 传输 线 
C. 一 定 有 时 钟 信号 线 用 于 总 线 操作 的 定时 
D. 每 个 时 钟 周期 内 只 能 并 行 传输 一 次 数据 
20. 下 列 关 于 异步 总 线 的 叙述 中 ,错误 的 是 (  )。 
A. 需要 应 答 ( 握 手 ) 信 和 号 
B. 需 用 一 个 公共 的 时 钟 信号 进行 同步 
C. 可 以 实现 高 可 靠 的 数据 传输 
D. 挂 接 在 总 线 上 的 各 部 件 可 以 有 较 大 的 速度 差异 
21. 以 下 有 关 总 线 标准 的 叙述 中 ,错误 的 是 (  )。 
A. 引入 总 线 标准 便于 设备 互 换 和 新 设备 的 添加 
B. 主板 上 的 处 理 器 总 线 和 存储 器 总 线 通常 是 专用 总 线 
C. 1/O 总 线 通常 是 标准 总 线 , 所 以 PCI 总 线 是 标准 总 线 
D. 串 行 传输 的 数据 传输 率 一 定 比 并 行 传输 的 数据 传输 率 低 
22. 下 列 选项 中 的 英文 缩写 均 为 总 线 标准 的 是 (  )。 
A. PCI.CRT.USB.EISA B. ISA .CPI.VESA.EISA 
C. ISA.SCSI.RAM.MIPS D. ISA、EISA、PCI.PCLExpress 
23. 以 下 有 关 多 总 线 结构 系统 的 叙述 中 ,错误 的 是 (。”)。 
A. 通常 越 靠近 CPU 的 总 线 传输 速率 越 高 
B. 通常 在 总 线 和 总 线 之 间 用 桥接 器 连接 
C. 处 理 器 总 线 和 存储 器 总 线 都 比 1/O 总 线 快 
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24. 


25. 


26. 


人 


28. 


29. 


30. 


31. 


D. 系统 中 多 个 总 线 不 可 能 同时 传输 信息 

主机 和 外 设 之 间 的 正确 连接 通路 是 ( pa 

A. CPU 和 主 存 一 1/O 总 线 一 1/O 接口 (外 设 控制 器 ) 一 通信 总 线 (电缆 ) 一 外 设 
B.CPU 和 主 存 一 I/O 接口 (外 设 控制 器 ) 一 1/O 总 线 一 通信 总 线 (电缆 ) 一 外 设 
C， CPU 和 主 存 一 1/O 总 线 一 通信 总 线 (电缆 ) 一 1/O 接口 (外 设 控制 器 ) 一 外 设 
D. CPU 和 主 存 一 1/O 接口 (外 设 控制 器 ) 一 通信 总 线 (电缆 ) 一 1/O 总 线 一 外 设 
以 下 有 关 1/O 接口 功能 和 结构 的 叙述 中 ,错误 的 是 (。””)。 

A. I/O 接口 就 是 像 显 卡 或 网 卡 之 类 的 一 种 外 设 控 制 逻辑 

B. CPU 可 以 向 1/O 接口 传送 用 来 对 设备 进行 控制 的 命令 

C. CPU 可 以 从 1/O 接口 取 状 态 信息 ,以 了 解 接口 和 外 设 的 状态 

D. I/O 接口 中 主机 侧 数 据 宽度 与 设备 侧 数据 宽度 总 是 一 样 

以 下 有 关 1/O 端口 的 叙述 中 ,错误 的 是 (。”)。 

A. 1/O 接口 中 程序 可 访问 的 寄存 器 被 称 为 7O 端口 

B. 1/O 接口 中 有 命令 端口 状态 端口 和 数据 端口 

C. 1/O 端口 可 以 和 主 存 统一 编号 ,也 可 以 单独 编号 

D. 1/O 接口 中 命令 端口 和 状态 端口 不 能 共用 同一 个 

以 下 给 出 的 部 件 中 ,不 包含 在 外 设 控制 接口 电路 中 的 是 (  )。 

A. 标志 寄存 器 B. 数据 缓存 器 

C. 命令 (控制 ) 寄 存 器 D. 状态 寄存 器 

以 下 有 关 统 一 编 址 方式 的 描述 中 ,错误 的 是 (  )。 

A. I/O 端口 地 址 和 主 存 地 址 一 定 不 重 号 

B. CPU 通过 执行 访 存 指令 来 访问 IO 端口 

C. 根据 指令 类 型 可 区 分 访问 主 存 还 是 访问 1/O 端口 

D. 可 利用 主 存 的 存储 保护 措施 对 1/O 端口 进行 存储 保护 

以 下 给 出 的 通信 总 线 ( 连 接 外 设 控制 器 和 外 设 ) 中 ,可 以 采用 并 行 传输 方式 的 是 











A. USB B. RS-232 


C: SESI D. IEEE 1394( 火 线 ) 

以 下 1/O 控制 方式 中 ,主要 由 硬件 而 不 是 软件 实现 数据 传送 的 方式 是 (。”)。 
A. 程序 查询 方式 B. 中 断 方式 

C. DMA 方式 D. 无 条 件 程序 控制 方式 


以 下 是 有 关 程 序 直接 控制 (查询 )I/O 方式 的 叙述 : 


@ 无 条 件 传送 接口 中 不 记录 状态 ,无 须 状态 查询 ,可 直接 定时 访问 。 

@ 条 件 传送 接口 中 有 “就 绪 “ 完 成 "等 状态 ,可 定时 查询 或 独占 查询 。 

@ 通过 CPU 执行 相应 的 无 条 件 传送 程序 或 查询 程序 来 完成 数据 传送 。 

@ 适合 于 巡回 检测 采样 系统 或 过 程控 制 系统 ,以 及 非 随机 启动 的 字符 型 设备 。 
以 上 叙述 中 ,正确 的 有 ( ”)。 


32. 


A. 四 和 @ B. OD 和 @ 和 ® C. D 和 ® 和 @ D. 全 部 
下 列 选项 中 ,能 引起 外 部 中 断 的 事件 是 (。”)。 
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A. 鼠标 输入 B. 除数 为 0 C. 浮 点 运算 下 洪 ” D. 访 存 缺 页 
33. 下 列 选项 中 , 不 属于 外 部 中 断 的 事件 是 (  )。 
A. 采样 定时 到 B. 无 效 操作 码 C. 打印 机 缺 纸 D. 键盘 缓冲 满 
34. 下 列 选项 中 ,能 引起 外 部 中 断 请 求 的 事件 是 (  )。 
A. 一 条 指令 执行 结束 B. 一 次 总 线 传输 结束 
C. 一 次 中 断 处 理 结束 D. 一 次 DMA 操作 结束 
35. 以 下 ( ) 情 况 出 现时 ,会 引起 CPU 自动 查询 有 无 中 断 请 求 ,进而 可 能 进入 中 断 
响应 周期 。 
A. 一 条 指令 执行 结束 B. 一 次 1/O 操作 结束 
C. 一 次 中 断 处 理 结束 D. 一 次 DMA 操作 结束 
36. 以 下 有 关 CPU 响应 外 部 中 断 请 求 的 叙述 中 ,错误 的 是 ( ji 
A. 每 条 指令 结束 后 ,CPU 都 会 转 到 “中 断 响应 ”周期 进行 中 断 响应 处 理 
B. 在 “中 断 响应 ”周期 ,CPU 将 中 断 允 许 触发 器 清 零 , 以 使 CPU 关中 断 
C. 在 “中 断 响应 ”周期 ,CPU 把 后 继 指 令 地址 作为 返回 地 址 保存 在 固定 地 方 
D. 在 “中 断 响应 ”周期 ,CPU 把 取得 的 中 断 服务 程序 的 入 口 地 址 送 PC 
37. 单 级 中 断 系 统 中 ,中 断 服务 程序 内 的 执行 顺序 是 ( 全 
I . 保护 现场 开 . 开 中 断 于 . 关中 断 .保存 断 点 
V. 中 断 事件 处 理 ” VE. 恢复 现场 ”WE. 中 断 返 回 
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A. I>V>V>[ B: 看 一 工 二 = 肌 

C. HI>N>V>V—\ D. >I>V>VY>\ 
38. 中 断 向 量 地 址 是 指 ( ””)。 

A. 子 程序 人 口 地 址 B. 中 断 服务 程序 入 口 地 址 


C. 中 断 服务 程序 入 口 地 址 的 地 址 D. 中 断 查询 程序 的 人 口 地 址 
39. 以 下 操作 中 ,不 是 通过 执行 指令 而 是 由 硬件 完成 的 是 (  )。 
A. 保护 断 点 B. 保护 现场 C. 设置 中 断 屏蔽 字 D.， 从 I/O 接口 取 数 
40. 设置 中 断 屏蔽 字 可 以 动态 地 改变 ( 。  ) 优 先 级 。 
A. 中 断 查询 B. 中 断 响 应 C. 中 断 处 理 D. 中 断 返 回 
41. 开 中 断 和 关中 断 两 种 操作 都 用 于 对 ( 。” ”) 进 行 设置 。 
A. 中 断 允许 触发 器 B. 中 断 屏蔽 寄存 器 
C. 中 断 请 求 寄存 器 D. 中 断 向 量 寄存 器 
42. 以 下 有 关中 断 I/O 方式 的 叙述 中 ,错误 的 是 (  )。 
A. 中 断 请 求 的 是 CPU 时 间 ,要 求 CPU 执行 程序 来 处 理发 生 的 相关 事件 
B.CPU 对 外 部 中 断 的 响应 不 可 能 发 生 在 一 条 指令 的 执行 过 程 中 
C. 中 断 1/0 方 式 下 ,外 设 接口 中 的 数据 和 CPU 中 的 寄存 器 内 容 直接 交换 
D. 只 要 有 中 断 请 求 发 生 ,那么 一 条 指令 执行 结束 后 CPU 就 进入 中 断 响应 周期 
43. 假设 计算 机 系统 中 软盘 以 中 断 方式 与 CPU 进行 数据 交换 , 主 频 为 50MHz, 传 输 单 
位 为 16 位 ,软盘 的 数据 传输 率 为 50kB/s。 若 每 次 数据 传输 的 开销 (包括 中 断 响应 和 中 断 处 
理 ) 为 100 个 时 钟 周期 , 则 软盘 工作 时 CPU 用 于 软盘 数据 传输 的 时 间 占 整个 CPU 时 间 的 百 
分 比 是 ( )。 
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A. 0% B. 5% C. 1.5% D. 15% 
44. 周期 挪用 方式 常用 于 (  ) 方 式 的 输入 输出 控制 中 。 
A. DMA B. 中 断 C. 程序 查询 D. 通道 


45. 采用 周期 挪用 方式 进行 数据 传送 时 ,每 传送 一 个 数据 要 占用 一 个 (  ) 的 时 间 。 
A. 指令 周期 B. 机 器 周期 C. 时 钟 周期 D. 存储 周期 
46. DMA 方式 的 数据 交换 不 是 由 CPU 执行 一 段 程序 来 完成 ,而 是 在 ( ) 之 间 建 立 
一 条 逻辑 上 的 直接 数据 通路 ,由 DMA 控制 器 来 实现 的 。 
A. CPU 与 主 存 ”B. 外 设 与 主 存 C. 外 设 与 CPU ” D. 外 设 与 外 设 
47. 启动 一 次 DMA 传送 ,外 设 和 主机 之 间 将 完成 一 个 ( 。””) 的 数据 传送 。 
A. 字 节 B. 字 C. 总 线 宽度 D. 数据 块 
48. 以 下 是 有 关 DMA 方式 的 叙述 : 
@ DMA 控制 器 向 CPU 请 求 的 是 总 线 使 用 权 。 
@ DMA 方式 可 用 于 键盘 和 鼠标 器 的 数据 输入 。 
@ DMA 方式 下 整个 1/0 过 程 完全 不 需要 CPU 介入 。 
@ DMA 方式 需要 用 中 断 处 理 进行 辅助 操作 。 
以 上 叙述 中 ,错误 的 是 (。””)。 
A. D 和 ® B. O 和 ®@ C. DO 和 @ D. @ 和 Q@ 
49. 以 下 关于 DMA 控制 器 和 CPU 关系 的 叙述 中 ,错误 的 是 (  )。 
A. DMA 控制 器 和 CPU 都 可 以 作为 总 线 的 主 控 设 备 
B. DMA 控制 器 和 CPU 都 要 使 用 总 线 时 ,CPU 优先 级 更 高 
C. CPU 可 通过 执行 1/O 指令 来 访问 DMA 控制 器 中 的 I/O 端口 
D. CPU 可 通过 执行 1//O 指令 来 启动 进行 DMA 传送 的 设备 
50. 以 下 关于 I/O 子 系统 的 描述 中 ,错误 的 是 (  )。 
A. 1/0 子 系统 包含 1/0 软件 和 1/O 硬件 两 大 部 分 
B. 1/O 软件 包含 用 户 空间 1/O 软件 部 分 和 内 核 空间 1/O 软件 部 分 
C. 内 核 空间 1/O 软件 包含 设备 无 关 软 件 ,设备 驱动 程序 和 中 断 服务 程序 
D. 直接 控制 I/O 硬件 的 是 设备 驱动 程序 ,而 不 是 中 断 服务 程序 
【参考 答案 】 
下 
I 16. D 17.D 了 A 1 D 20;B 
入 区 而 .2 本 允 2 
3 233 36. A 37.A 38.C 39.A 40. C 
41. A 42. D 43. B 44. 46. B 47. D 48. B 49. B 50. D 
【部 分 题目 的 答案 解析 】 
1. 从 系统 A 的 能 力 来 看 , 它 每 秒 能 够 处 理 的 事务 数 为 50000 000/(10000X5) 王 1000。 
但 是 ,因为 系统 A 每 秒 最 多 发 出 1000 次 1/O 操作 ,因而 每 秒 所 包含 的 事务 数 最 多 仅 有 
1000/5 二 200 个 。 因 此 ,答案 为 选项 A。 
6. 采用 中 断 方式 进行 打印 控制 时 ,通常 将 打印 机 作为 字符 型 设备 (例如 针 式 打印 机 ) 使 
用 。 对 于 这 类 打印 机 的 控制 过 程 通常 是 ,CPU 先 将 需 打 印 的 字符 编码 送 到 打印 控制 接口 


25. 
35. 
45. 


关口 天 天 
已 疡 已 吕 


互 过 及 输入 输出 组 织 


(也 称 为 打印 适配器 或 打印 控制 器 ) 中 ,打印 控制 接口 再 将 字符 编码 转换 为 点 阵 信息 ,然后 通 
过 打印 电缆 传送 到 打印 机 ,以 控制 打印 针头 在 何 处 进行 打印 。 同 时 ,打印 控制 接口 需要 将 
“初始 化 “ 选 通 “自动 走 纸 ”等 打印 控制 信息 通过 电缆 传送 到 打印 机 ,并 通过 电缆 把 打印 机 
的 “联机 “ 忙 “ 缺 纸 ” 等 状态 信号 取 到 打印 控制 接口 ,以 供 CPU 来 读 取 。 因 此 ,选项 A、B 和 
C 的 说 法 都 是 正确 的 。 

中 断 请 求 信号 是 打印 控制 接口 通过 中 断 控 制 器 (PIC) 发 送 给 CPU 的 ,所 以 ,不 在 打印 
控制 接口 和 打印 机 之 间 进 行 交换 ,因而 选项 DD 的 说 法 是 错误 的 。 答 案 为 选项 D。 

7. 激光 打印 机 是 一 种 非 击 打 式 印字 机 ,其 打印 机 控制 器 由 功能 较 强 的 处 理 器 缓冲 存 
储 器 以 及 相应 的 辅助 电路 构成 , 它 的 功能 包括 : 缓存 并 解释 主机 送 来 的 打印 语言 描述 命令 
(包括 打印 机 控制 命令 、 页 面 格式 命令 ,字体 处 理 命令 、 图 形 命 令 等 ) .格式 化 打印 内 容 ( 如 纸 
张 尺寸 .边界 设 定 , 字 符 的 大 小 与 位 置 等 ) ,并 进行 光栅 化 处 理 (把 经 过 格式 化 的 页 面 数据 转 
换 成 点 阵 数 据 ) 等 。 由 此 可 见 , 主 机 送 到 打印 控制 器 中 的 是 页 面 描述 信息 和 各 种 命令 ,打印 
点 阵 信 息 是 由 打印 控制 器 通过 对 页 面 数据 经 过 光栅 化 而 得 到 的 ,因此 ,打印 点 阵 信息 不 可 能 
是 主机 送 到 打印 控制 器 的 。 因 此 ,选项 A 的 说 法 是 错误 的 ,而 选项 B.C.D 的 说 法 是 正确 
的 。 答 案 为 选项 A。 

8. 为 了 达到 屏幕 刷新 所 需 的 要 求 ,带宽 必须 达到 1600X1200X24X85/108 一 3916.8Mbps。 
因为 这 个 仅 占 显存 带宽 的 50% ,所 以 显存 总 带宽 至 少 为 2X3916. 8 妾 7834Mbps。 因 此 , 选 
项 D 正确 。 答 案 为 选项 D。 

9. 因为 每 个 盘面 有 一 个 磁头 ,所 以 盘面 号 和 磁头 号 是 同一 个 概念 ,显然 选项 A 的 说 法 
是 错误 的 。 盘 地 址 应 该 由 磁道 号 ( 柱 面 号 ) .磁头 号 (盘面 号 ) 和 扇 区 号 组 成 。 答 案 为 选项 A。 

10. 该 磁盘 存储 器 的 容量 为 4X2X2000X3000X512/10"<:24GB。 答 案 为 选项 D。 

11. 平均 磁盘 旋转 等 待 时 间 为 磁盘 转 一 圈 所 用 时 间 的 一 半 , 即 0. 5 Xx 60 X1000/7200 坊 
4.17ms。 一 个 扇 区 的 读 出 时 间 为 1000X512/10; 二 0. 512ms。 所 以 ,一 个 扇 区 的 平均 读 取 
时 间 大 约 为 20 十 4. 17 十 0. 512s*24. 7ms。 答 案 为 选项 C。 

13. RAID 技术 利用 完 余 的 校 验 信息 盘 来 提高 可 靠 性 , 校 验 信息 可 以 存放 在 单独 一 个 
磁盘 上 ,但 是 ,这 种 方式 使 得 校 验 盘 成 为 系统 的 瓶颈 ,所 以 ,后 来 的 方案 都 把 校 验 信息 分 散 存 
放 在 各 个 磁盘 中 。 例 如 ,RAID 5 和 RAID 6 中 的 奇偶 校 验 块 分 布 在 各 个 磁盘 中 。 因 此 选项 
C 的 说 法 是 错误 的 ,答案 为 选项 C。 

14. 系统 总 线 中 控制 线 的 主要 功能 是 提供 定时 信号、 操作 命令 和 各 种 请 求 /回答 信和 号 
等 ,因而 正确 答案 就 是 选项 A。 对 于 选项 C 和 D 的 说 法 ,显然 ,都 没有 选项 A 的 描述 全 面 。 
此 外 ,数据 信息 应 通过 专门 的 数据 线 进 行 交换 ,因此 选项 B 的 说 法 是 错误 的 。 

16. 同步 总 线 事 务 可 以 是 突 发 传输 方式 ,这 种 情况 下 ,一 个 总 线 事务 中 可 以 传输 多 个 连 
续 的 数据 ,每 次 传输 的 数据 位 数 不 超 过 总 线 宽度 。 显 然 ,选项 D 的 说 法 是 错误 的 ,答案 为 选 
项 D。 

18. 信号 线 复 用 技术 是 指 同一 组 信号 线 在 不 同 的 时 刻 传输 不 同 的 信息 。 例 如 ,地 址 线 
和 数据 线 复 用 ,表示 总 线 事务 开始 时 这 组 信号 线 用 来 传输 地 址 ,在 数据 传输 阶段 这 组 信号 线 
又 用 来 传输 数据 。 如 果 是 存储 器 写 总 线 事务 , 若 不 采用 地 址 线 和 数据 线 复 用 , 则 开始 时 
CPU 可 以 将 地 址 和 数据 同时 发 送 到 总 线 上 ,而 采用 地 址 线 和 数据 线 复 用 的 话 , 则 不 能 将 地 
址 和 数据 同时 发 送 ,必须 先 发 送 地 址 ,再 发 送 数据 。 显 然 , 这 样 会 延长 该 总 线 事务 的 时 间 ,也 
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就 不 能 提高 总 线 带 宽 。 因 此 ,答案 为 选项 A。 

19. 目前 内 存 条 大 多 采用 DDR、DDR2、DDR3 等 SDRAM 芯片 技术 ,与 这 种 内 存 条 相 
连 的 存储 器 总 线 ,每 个 时 钟 周 期 总 是 在 上 升 沿 和 下 降 沿 各 传送 一 次 数据 ,因此 ,一 个 时 钟 周 
期 内 可 以 并 行 传输 两 次 数据 。 显 然 ,选项 D 的 描述 是 错误 的 ,答案 为 选项 D。 

21. 因为 串 行 传输 方式 每 次 在 一 根 信号 线 上 传送 数据 位 ,传输 速率 可 以 比 并 行 总 线 高 
得 多 ,而 且 , 因 为 每 个 位 各 自传 输 ,因而 传输 时 延 的 细微 变化 不 会 影响 其 他 数据 位 的 传送 。 
通过 多 个 数据 通道 的 组 合 ,可 以 实现 比 传统 并 行 总 线 高 得 多 的 数据 传输 带宽 。 显 然 , 选 项 D 
的 说 法 是 错误 的 。 答 案 为 选项 D。 

25. 1/O 接口 中 主机 侧 通过 I/O 总 线 与 主机 相连 ,设备 侧 通 过 通信 总 线 (电缆 ) 与 外 设 
相连 ,显然 ,1/O 总 线 中 的 数据 线 宽度 和 连接 设备 的 电缆 中 的 数据 线 宽度 不 一 定 相 同 。 选 项 
D 的 说 法 是 错误 的 。 答 案 为 选项 D。 

26. 因为 CPU 对 1/O 接口 中 的 命令 端口 总 是 写 操作 ,对 状态 端口 总 是 读 操 作 , 因 此 , 命 
令 端 口 和 状态 端口 可 以 共用 同一 个 端口 ,当然 ,也 可 以 有 独立 的 命令 端口 和 独立 的 状态 端 
口 。 选 项 D 的 说 法 是 错误 的 。 答案 为 选项 D。 

28. 统一 编 址 方式 中 ,I/O 端口 地 址 和 主 存单 元 地 址 统一 编 址 。 它 们 各 自分 配 在 不 同 
的 地 址 范围 内 ,因此 ,I/O 端口 地 址 和 主 存单 元 地 址 一 定 不 重 号 。 选 项 A 的 说 法 正确 。 

统一 编 址 方式 中 ,CPU 通过 访 存 指令 来 访问 I/O 端口 ,只 要 根据 给 出 的 地 址 是 在 主 存 
地 址 范围 内 还 是 1O 地 址 范围 内 ,就 可 区 分 访问 的 是 主 存单 元 还 是 1/O 端口 ,而 且 可 以 把 
1/O 端口 的 空间 看 成 是 主 存 空间 的 一 部 分 ,利用 存储 保护 措施 对 I/O 端口 进行 存储 保护 。 
选项 B 和 D 的 说 法 正确 。 

因为 CPU 使 用 统一 的 访 存 指令 进行 访问 ,因此 ,无 法 通过 指令 类 型 来 区 分 访问 的 是 内 
存单 元 还 是 1/O 端口 。 选 项 C 的 说 法 不 正确 。 答 案 是 选项 C。 

32. 除数 为 0. 浮 点 运算 下 溢 和 访 存 时 缺 页 都 是 在 执行 某 条 指令 时 CPU 发 现 的 异常 事 
件 ,不 属于 外 部 中 断 请 求 事件 ,只 有 鼠标 输入 是 和 任何 指令 的 执行 无 关 的 、 能 引起 外 部 中 断 
的 事件 。 答 案 为 选项 A。 

33. 无 效 操作 码 是 由 CPU 在 对 某 条 指令 译 码 的 时 候 发 现 的 ,因而 是 内 部 异常 ,而 不 是 
外 部 中 断 。 定 时 采样 中 的 定时 时 间 到 打印 机 缺 纸 .键盘 缓冲 慢 都 是 与 任何 指令 的 执行 无 关 
的 .由 CPU 外 部 的 中 断 源 发 出 的 外 部 中 断 请 求 事件 。 答 案 为 选项 B。 

34. 外 部 中 断 请 求 事件 通常 是 由 于 外 部 设备 完成 I/O 任务 或 遇 到 像 打印 机 缺 纸 之 类 的 
异常 情况 需要 CPU 进行 处 理 时 向 CPU 发 出 的 一 种 请 求 信号 ,CPU 在 每 条 指令 执行 结束 时 
会 检测 这 个 请 求 信号 。 显 然 , 一 条 指令 执行 结束 、 一 次 总 线 传输 结束 和 一 次 中 断 处 理 结束 都 
不 可 能 引起 外 部 请 求 事件 ,而 DMA 操作 结束 时 需要 CPU 进行 数据 校 验 等 处 理 , 因 而 会 引 
起 外 部 中 断 请 求 事件 。 答案 是 选项 D。 

35. CPU 在 每 条 指令 执行 结束 时 会 检测 中 断 请 求 信号 , 若 该 信号 有 效 , 则 CPU 进入 中 
断 响应 周期 。 因 而 答案 为 选项 A。 

36. CPU 在 每 条 指令 执行 结束 时 检测 中 断 请 求 信号 。 若 检测 到 中 断 请 求 信号 有 效 , 则 
进入 中 断 响 应 周期 ; 若 检测 到 中 断 请 求 信号 无 效 , 则 不 会 进入 中 断 响应 周期 。 因 此 ,选项 A 
的 说 法 是 错误 的 。 答 案 为 选项 A。 

在 中 断 响应 周期 中 ,CPU 会 发 出 “中 断 回答 ”信号 ,该 信号 启动 中 断 控制 器 进行 中 断 查 
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询 , 中 断 控 制 器 根据 判 优 电路 和 编码 器 ,将 当前 未 被 屏蔽 的 中 断 源 中 具有 最 高 优先 权 的 中 断 
源 的 类 型 号 送 给 CPU,CPU 根据 中 断 源 的 类 型 号 得 到 相应 中 断 服务 程序 的 首 地 址 ,从 而 转 
中 断 服务 程序 执行 。 在 中 断 响 应 过 程 中 ,CPU 将 关中 断 、 保 存 断 点 和 程序 状态 ,这 里 , 断 点 
是 指 被 中 断 的 程序 在 中 断 返 回 后 继续 执行 时 开始 执行 的 指令 处 ,显然 ,这 里 断 点 应 该 是 进行 
中 断 请 求 信号 检测 时 刚刚 执行 完 的 指令 后 面 一 条 指令 的 地 址 。 综 上 所 述 , 选 项 B.C.D 的 说 
法 都 是 正确 的 。 

37. 单 级 中 断 系统 不 允许 在 中 断 服务 程序 执行 过 程 中 响应 新 的 中 断 请 求 ,因此 ,在 整个 
中 断 服务 程序 执行 过 程 中 ,CPU 应 该 一 直 处 于 关中 断 状态 。 在 进入 中 断 服 务 程序 执行 之 
前 ,CPU 在 中 断 响应 过 程 中 已 经 保存 断 点 和 关中 断 , 所 以 进入 中 断 服务 程序 后 ,无 须 再 保存 
断 点 和 关中 断 ,最 后 ,在 中 断 返回 之 前 再 开 中 断 。 因 此 , 单 级 中 断 系统 的 中 断 服务 程序 中 的 
处 理 顺 序 为 : 保护 现场 ~ 中 断 事件 处 理 一 恢复 现场 ~ 开 中 断 一 中 断 返 回 。 答 案 是 选项 A。 

39. 保护 断 点 的 工作 只 能 在 中 断 响应 期 间 由 硬件 (CPU) 完 成 ,否则 ,一 旦 进入 中 断 服务 
程序 执行 , 则 断 点 (PC 的 值 ) 就 会 因为 执行 指令 而 改变 ,导致 断 点 被 破坏 。 现 场 信息 是 指 通 
用 寄存 器 的 内 容 , 通 用 寄存 器 组 包含 几 个 或 几 十 个 寄存 器 ,保存 这 些 寄存 器 的 内 容 涉 及 多 次 
访问 存储 器 ,不 适合 在 中 断 响应 过 程 中 完成 ,否则 会 大 大 延长 中 断 响应 过 程 。 通 常 的 做 法 是 
在 中 断 服 务 程序 中 用 压 栈 指令 来 保护 现场 ,同样 ,设置 中 断 屏蔽 字 的 工作 也 是 在 中 断 服务 程 
序 中 用 指令 实现 的 ,用 输出 指令 (如 IA-32 中 的 OUT 指令 ) 直 接 将 屏蔽 字 输 出 到 中 断 屏蔽 
寄存 器 ,从 I/O 接口 中 的 数据 缓冲 寄存 器 取 数 或 向 其 中 写 入 数据 ,也 是 在 中 断 服务 程序 中 
用 输入 或 输出 指令 实现 的 。 

综 上 所 述 ,答案 为 选项 A。 

40. 首先 ,不 存在 中 断 查 询 优先 级 和 中 断 返回 优先 级 的 概念 。 

中 断 查询 过 程 是 在 CPU 检测 到 中 断 请 求 信号 (INTR) 后 向 中 断 控制 器 发 出 “中 断 回 
答 ” 信 息 所 启动 的 。 一 旦 启动 中 断 查 询 , 则 中 断 控制 器 中 的 判 优 电路 就 会 把 所 有 未 被 屏蔽 的 
中 断 请 求 源 进行 并 行 判 优 , 选 择优 先 级 最 高 的 中 断 源 类 型 号 送 给 CPU 予以 响应 ,这 里 的 优 
先 级 指 中 断 响 应 优先 级 , 即 表 示 被 CPU 优先 响应 的 顺序 。 

中 断 返 回 是 指 中 断 服 务 程序 执行 结束 后 返回 到 被 中 断 程序 执行 的 过 程 ,这 个 过 程 是 通 
过 执行 中 断 服务 程序 的 最 后 一 条 指令 (例如 IA-32 中 的 IRET 指令 ) 来 实现 的 。 

中 断 处 理 优先 级 反映 的 是 正在 处 理 的 中 断 是 否 比 新 发 生 的 中 断 的 处 理 优先 级 低 ( 即 屏 
项 位 为 0, 对 新 中 断 开 放 ) ,如 果 是 ,就 中 止 正在 处 理 的 中 断 , 转 到 新 中 断 服务 程序 去 执行 ,处 
理 完 后 回 到 原 被 中 止 的 中 断 服务 程序 继续 执行 。 中 断 处 理 优先 级 可 以 由 中 断 屏蔽 字 来 动态 

综 上 所 述 ,答案 为 选项 C。 

42. 选项 A 的 说 法 显然 是 正确 的 ,中 断 请 求 就 是 要 求 CPU 执行 程序 来 处 理发 生 的 相关 
事件 。 

选项 B 的 说 法 也 是 正确 的 ,如 果 可 以 在 一 条 指令 执行 的 中 途 响应 中 断 请 求 ,那么 ,中 断 
返回 后 该 从 一 条 指令 执行 的 中 途 开始 继续 执行 ,这 显然 是 无 法 做 到 的 。 

选项 C 的 说 法 也 是 正确 的 ,CPU 响应 中 断后 会 调 出 中 断 服务 程序 ,在 中 断 服务 程序 执 
行 过 程 中 ,CPU 会 执行 相应 的 输入 输出 指令 ,实现 CPU 中 的 通用 寄存 器 和 外 设 接 口 (设备 
控制 器 ) 中 的 1/O 端口 之 间 的 直接 数据 交换 。 
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选项 D 的 说 法 是 错误 的 ,在 以 下 两 种 情况 下 不 正确 : 关中 断 (禁止 中 断 ) 时 ,虽然 有 中 
断 请 求 发 生 并 在 一 条 指令 执行 结束 ,CPU 因为 不 允许 响应 中 断 而 不 会 进入 中 断 响应 周期 ; 
@ 当 有 中 断 请 求 的 请 求 源 被 屏蔽 (由 中 断 控制 器 的 中 断 屏 项 字 寄 存 器 的 相应 屏蔽 位 进行 屏 
蔽 ) 时 ,因为 对 应 的 中 断 请 求 源 被 屏蔽 了 ,因此 中 断 控 制 器 无 法 向 CPU 发 出 中 断 请 求 信号 

48. 叙述 显然 是 正确 的 。DMA 控制 器 向 CPU 提出 DMA 请 求 ,是 希望 CPU 让 出 总 
线 控制 权 , 由 DMA 控制 器 控制 总 线 , 完 成 外 设 和 主 存 之 间 的 数据 传送 。 

叙述 @ 显 然 是 错误 的 。DMA 方式 适合 用 于 进行 块 传送 的 高 速 设备 。 

叙述 @ 是 错误 的 。DMA 方式 下 ,在 DMA 控制 器 进行 具体 的 数据 传送 之 前 ,需要 CPU 
执行 初始 化 程序 ,来 对 DMA 控制 器 进行 初始 化 处 理 , 包 括 设置 传送 数据 个 数 .内 存 起 始 地 
址 等 参数 。 

叙述 @ 是 正确 的 。DMA 方式 下 , 当 DMA 控制 器 完成 具体 的 数据 传送 之 后 ,会 向 CPU 
发 送 *DMA 结束 ”中 断 请 求 ,CPU 执行 相应 的 中 断 服务 程序 ,进行 数据 校 验 等 后 处 理工 作 。 

答案 是 选项 B。 

50. 选项 D 的 说 法 是 不 正确 的 。 中 断 服务 程序 需要 完成 CPU 与 1/O 接口 之 间 的 数据 
交换 ,因而 要 能 够 通过 发 送 控制 命令 字 来 启动 外 设 , 即 能 够 直接 控制 I/O 硬件。 因此 ,驱动 
程序 和 中 断 服务 程序 属于 和 设备 相关 的 1/O 软件 部 分 。 答 案 为 选项 D。 


8.6 分 析 应 用 题 


1. 对 于 磁盘 来 说 , 扇 区 的 编号 方式 直接 影响 磁盘 数据 的 读 写 时 间 。 图 8. 1 所 示 的 两 种 
扇 区 编号 方式 中 , 哪 一 种 编号 方式 可 能 具有 更 好 的 性 能 ? 


GN AN 
:信人 小， 
Ns NA 


(a) 连续 编号 (b) 交叉 编号 
图 8.1 磁盘 扇 区 编号 方式 


【分 析 解 答 】 

交错 因子 是 指 每 两 个 连续 旭 辑 扇 区 之 间 所 间隔 的 物理 扇 区 数 。 显 然 ,图 8. 1(a) 所 示 的 
交错 因子 是 0, 图 8. 1(b) 所 示 的 交错 因子 是 2。 交 错 因子 是 硬盘 低级 格式 化 时 需要 给 定 的 
一 个 主要 参数 ,具体 数值 视 硬 盘 类 型 而 定 。 交 错 因 子 对 硬盘 的 存 取 速 度 有 很 大 影响 。 虽 然 
硬盘 的 物理 扇 区 在 磁道 上 是 连续 排列 的 ,但 进行 格式 化 后 的 好 辑 扇 区 却 是 交叉 排列 的 ,也 就 
是 说 ,连续 的 物理 扇 区 对 应 不 连续 的 逻辑 扇 区 。 

硬盘 每 当 访问 一 个 逻辑 扇 区 后 , 需 等 待 主机 将 该 扇 区 的 输出 数据 处 理 完毕 后 才能 进行 
下 一 个 扇 区 的 读 写 。 在 这 个 等 待 过 程 中 ,硬盘 可 能 已 经 转 过 了 几 个 物理 扇 区 。 如 果 交 错 因 








互 过 及 输入 葵 出 组 织 


子 选择 过 小 , 则 对 应 下 一 个 逻辑 扇 区 的 物理 扇 区 已 转 过 磁头 , 需 等 待 磁盘 再 转 一 圈 后 才能 读 
写 ; 如 果 交 错 因 子 选取 过 大 , 则 对 应 下 一 个 逻辑 扇 区 的 物理 扇 区 还 未 转 到 磁头 处 ,需要 继续 
等 待 。 因 此 ,选择 合适 的 交错 因子 ,可 使 当前 扇 区 到 下 一 个 待 读 写 的 逻辑 扇 区 之 间 没 有 等 竺 
时 间或 具有 最 短 的 等 待 时 间 , 从 而 明显 提高 硬盘 的 读 写 速度 。 因 此 ,图 8. 1(b) 所 示 的 交叉 
编号 方式 可 能 具有 更 好 的 性 能 。 

2. 假定 有 一 个 磁盘 存储 器 ,磁盘 片 外 径 为 355. 6mm, 有 20 个 记录 面 ,每 面 有 51mm 区 
域 用 于 记录 信息 , 道 密度 为 3. 92tpm ( 道 /毫米 ), 位 密度 为 90bpm (位 /毫米 ) ,转速 为 
2400rpm, 道 间 移 动 时 间 为 0. 2ms。 请 问 

(1) 磁盘 容量 约 为 多 少 ? 如 果 道 密度 和 位 密度 同时 扩大 为 100 倍 , 则 容量 约 为 多 少 ? 

(2) 平均 存 取 时 间 和 平均 数据 传输 率 各 为 多 少 ? 

(3) 如 果 在 道 密度 和 位 密度 同时 扩大 为 100 倍 的 同时 转速 扩大 为 3 倍 , 则 平均 存 取 时 
间 和 平均 数据 传输 率 各 为 多 少 ? 

【分 析 解 答 】 

(1) 每 面 磁道 数 为 51X3.92s*200 道 , 给 出 的 位 密度 是 指 最 内 圈 上 的 位 密度 。 所 以 ,最 
内 圈 周 长 为 3. 14X(355.6 一 2X51)s796. 3mm, 故 每 道 信息 量 为 796. 3X90 兰 71664b, 因 
此 ,磁盘 容量 为 20X200X71664 王 286656000bs*273Mb(1M=22)。 若 道 密度 和 位 密度 同 
时 扩大 为 100 倍 , 则 磁道 数 扩大 为 100 倍 , 每 道 容 量 扩大 为 100 倍 ,所 以 整个 盘 组 容量 扩大 
为 10000 倍 ,磁盘 容量 大 约 为 273MX104 位 六 2666Gbs*333GB(1G 王 23) 。 

(2) 平均 寻 道 时 间 为 (199X0. 2 十 0)/2 王 19. 9ms; 转 一 圈 的 时 间 为 60 X1000/2400= 
25ms, 平 均 (旋转 ) 等 待 时 间 为 (25 十 0)/2 二 12. 5ms。 平 均 存 取 时 间 为 平均 寻 道 时 间 与 平均 
寻 道 时 间 之 和 , 即 19. 9 十 12. 5 二 32. 4ms。 平 均 数 据 传输 率 为 71664X 103/25 守 2. 87Mb/s 
(1M=10°)。 

(3) 道 密度 扩大 为 100 倍 , 则 平均 寻 道 时 间 约 为 (19999X0. 002 十 0)/2 王 20ms; 转 速 扩 
大 为 3 倍 , 则 转 一 圈 的 时 间 缩 短 为 25/3 二 8. 33ms ,平均 等 待 时 间 缩短 为 8.33/2==4. 2ms, 故 
平均 存 取 时 间 为 20 十 4.2 二 24. 2ms。 位 密度 扩大 为 100 倍 , 则 每 道 容量 扩大 为 100 倍 , 转 速 
扩大 为 3 倍 , 则 转 一 圈 的 时 间 缩短 为 1/3, 因 此 ,平均 数据 传输 率 共 扩 大 为 100X3=300 倍 ， 
即 平均 数据 传输 率 为 300X2. 87 二 861Mb/s。 

3. 假定 一 个 程序 重复 完成 以 下 操作 : 将 磁盘 上 一 个 4KB 的 数据 块 读 出 ,进行 相应 处 理 
后 , 写 回 到 磁盘 的 另外 一 个 数据 区 。 各 数据 块 内 信息 在 磁盘 上 连续 存放 ,数据 块 随机 地 位 于 
磁盘 的 一 个 磁道 上 上。 磁盘 转速 为 7200rpm, 平 均 寻 道 时 间 为 10ms, 磁 盘 最 大 数据 传输 率 为 
40MBps, 磁 盘 控制 器 的 开销 为 2ms, 没 有 其 他 程序 使 用 磁盘 和 处 理 器 ,并 且 磁 盘 读 写 操作 和 
磁盘 数据 的 处 理 时 间 不 重合 。 若 程序 对 磁盘 数据 的 处 理 需 要 20 000 个 时 钟 周 期 ,处 理 器 时 
钟 频率 为 500MHz, 则 该 程序 完成 一 次 数据 块 “ 读 出 一 处 理 一 写 回 "操作 所 需 的 时 间 为 多 少 ? 
每 秒 可 以 完成 多 少 次 这 样 的 数据 块 操作 ? 

【分 析 解 答 】 

磁盘 旋转 一 圈 的 时 间 为 1000/(7200/60) 守 8. 33ms, 故 平均 旋转 等 待 时 间 约 为 8. 33/2 之 
4.17ms。 因 为 数据 块 内 信息 连续 ,所 以 ,一 个 数据 块 的 传输 时 间 为 4X2”/(40 X10°)= 
0. 1024ms, 因 而 数据 块 的 平均 读 取 或 写 回 时 间 为 2 十 10 十 4. 17 十 0. 1024s:16. 27ms。 数 据 
块 的 处 理 时 间 为 20000/(500X10)X1000==0.04ms。 因 为 数据 块 随机 存放 在 某 个 磁道 上 ,所 
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以 ,每 个 数据 块 的 “ 读 出 一 处 理 一 写 回 ? 操 作 时 间 都 是 相同 的 ,其 整个 时 间 为 16. 27X2 十 
0. 04 王 32. 58ms。 所 以 每 秒 可 以 完成 这 样 的 数据 块 操作 次 数 是 1000/32. 58s*30 次 。 

4. 假定 有 两 个 用 来 存储 10TB 数据 的 RAID 系统 。 系 统 A 使 用 RAID 1 技术 ,系统 B 
使 用 RAID 5 技术 。 

(1) 系 统 A 比 系统 也 需要 多 用 多 少 存储 容量 ? 

(2) 假定 某 个 应 用 需要 向 磁盘 写 入 一块 数据 , 若 磁盘 读 或 写 一块 数 据 的 时 间 为 30ms， 
则 最 坏 情 况 下 ,在 系统 A 和 系统 B 上 写 入 一块 数 据 分 别 需 要 多 长 时 间 ? 

(3) 哪个 系统 更 可 靠 ? 为 什么 ? 

【分 析 解 答 】 

(1) 系统 A 使 用 RAID 1 技术 ,采用 磁盘 镜像 方式 存储 ,所 以 ,所 用 磁盘 容量 为 10 十 
10 二 20TB。 系 统 B 使 用 RAID 5 技术 ,采用 一 个 奇偶 校 验 盘 ,假设 使 用 5 个 磁盘 阵列 ,那么 
10TB 的 数据 需要 2. 5TB 来 存放 元 余 的 奇偶 校 验 数据 ,所 以 系统 A 比 系统 B 多 用 7.5TB 存 
储 容量 。 

(2) 系统 A 的 写 人 速度 取决 于 两 个 磁盘 中 速度 慢 的 那个 ,因为 所 有 盘 写 一 块 数据 的 时 
间 都 是 30ms, 故 系统 A 写 和 一块 数 据 的 时 间 是 30ms。 对 于 系统 B, 最 坏 的 情况 下 , 写 一 块 
数据 的 时 间 为 2 次 读 和 2 次 写 , 即 所 用 时 间 为 4X30 王 120ms。 

(3) 系统 A 更 可 靠 ,因为 系统 对 整个 磁盘 都 进行 了 备份 ,所 以 即使 所 有 的 数据 都 损坏 
了 也 可 以 恢复 。 而 系统 B 只 是 记录 了 部 分 宛 余 信息 ,如 果 两 个 磁盘 的 相同 位 都 损坏 了 就 恢 
复 不 出 来 了 。 

5. 假定 在 一 个 使 用 RAID 5 的 系统 中 ,采用 先 更 新 数据 块 .再 更 新 校 验 块 的 信息 更 新 
方式 。 如 果 在 更 新 数据 块 和 更 新 校 验 块 的 操作 之 间 发 生 了 掉 电 现象 ,那么 会 出 现 什么 问题 ? 
采用 什么 样 的 信息 更 新 方式 可 避免 这 个 问题 ? 

【分 析 解 答 】 

对 于 RAID 5 来 说 ,如 果 在 写 完 数据 块 但 未 写 入 校 验 块 时 发 生 断 电 , 则 写 入 的 数据 和 对 
应 的 校 验 信息 不 匹配 ,无 法 正确 恢复 数据 。 这 种 情况 可 以 避免 ,因为 RAID 5 是 大 数据 块 交 
叉 方式 ,每 个 盘 独 立 进行 操作 ,所 以 ,只 要 同时 写 数据 块 所 在 盘 和 校 验 块 所 在 盘 即 可 。 

6. 假设 一 个 32 位 的 处 理 器 连接 了 一 个 32 位 宽 的 处 理 器 总 线 ,总 线 的 时 钟 频率 为 
400MHz, 支 持 多 种 总 线 事务 类 型 。 其 中 ,最 短 的 总 线 事务 类 型 是 存储 器 读 事务 ,需要 4 个 
时 钟 周期 完成 ,第 1 个 时 钟 周期 送 地 址 和 读 命令 ,第 4 个 时 钟 周期 取 数 ;最 长 的 总 线 事务 类 
型 是 突 发 传送 8 次 数据 ,需要 11 个 时 钟 周期 完成 ,第 1 个 时 钟 周期 送 地 址 和 读 命令 ,第 4 个 
时 钟 周期 开始 连续 传送 8 个 数据 ,每 个 时 钟 周 期 传送 一 次 。 请 回答 下 列 问 题 : 

(1) 该 总 线 是 同步 总 线 还 是 异步 总 线 ? 为 什么 ? 

(2) 该 总 线 的 最 大 数据 传输 率 为 多 少 ? 

(3) 若 处 理 器 一 直 持 续 发 起 最 短 总 线 事务 类 型 , 则 此 时 总 线 的 数据 传输 率 是 多 少 ? 

(4) 若 处 理 器 一 直 持 续 发 起 最 长 总 线 事务 类 型 , 则 此 时 总 线 的 数据 传输 率 是 多 少 ? 

(5) 若 将 处 理 器 总 线 的 总 线 宽度 扩展 为 64 位 , 则 该 总 线 的 最 大 数据 传输 率 提高 到 
多 少 ? 

(6) 若 将 处 理 器 总 线 的 总 线 时 钟 频率 提高 到 800MHz, 则 该 总 线 的 最 大 数据 传输 率 提 
高 到 多 少 ? 
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(7) 加 们 总 线 宽度 和 加 倍 总 线 时 钟 频率 相 比 , 哪 种 更 好 ? 

【分 析 解 答 】 

(1) 该 总 线 是 同步 总 线 , 因 为 所 有 总 线 操 作 都 在 总 线 时 钟 的 控制 下 进行 。 

(2) 总 线 最 大 数据 传输 率 就 是 总 线 带宽 ,表示 在 总 线 上 传输 数据 时 单位 时 间 内 传输 的 
最 大 数据 量 ,由 总 线 宽度 W .总线 时 钟 频率 下 和 一 个 时 钟 周期 内 传输 的 数据 个 数 M 确定 。 
其 值 为 WXFXM。 该 总 线 的 最 大 数据 传输 率 为 32b X 400 X 1/1000 = 12. 8Gb/s= 
1. 6GB/s。 

(3) 进行 最 短 总 线 事务 类 型 时 ,总线 数据 传输 率 为 4X400/4 一 400MB/s。 

(4) 进行 最 长 总 线 事 务 类 型 时 ,总 线 数据 传输 率 为 4X8X400/11s*1164MB/s。 

(5) 若 总 线 宽度 扩展 一 倍 , 则 总 线 最 大 数据 传输 率 提高 一 倍 , 为 3. 2GB/s。 

(6) 若 总 线 时 钟 频率 提高 一 倍 , 则 总 线 最 大 数据 传输 率 提高 一 倍 ,为 3. 2GB/s。 

(7) 加 信和 总 线 宽度 和 加 倍 总 线 时 钟 频率 的 措施 对 于 总 线 速度 来 说 效果 是 一 样 的 。 

7. 存储 器 总 线 采 用 同步 通信 方式 ,假定 时 钟 频率 为 55MHz 时 钟 ,每 个 总 线 事 务 以 突 发 
方式 传输 8 个 字 , 以 支持 块 长 为 8 个 字 的 Cache 行 读 和 Cache 行 写 ,每 字 4B。 对 于 读 操作 ， 
访问 顺序 是 : 1 个 时 钟 周期 接受 地 址 ,3 个 时 钟 周期 等 待 存储 器 读数 ,8 个 时 钟 周期 用 于 传 
输 8 个 字 。 对 于 写 操作 ,访问 顺序 是 : 1 个 时 钟 周期 接受 地 址 ,2 个 时 钟 周期 延迟 ,8 个 时 钟 
周期 用 于 传输 8 个 字 ,3 个 时 钟 周期 恢复 和 写 入 纠 错 码 。 

(1) 该 存储 器 总 线 的 带宽 是 多 少 ? 

(2) 当 全 部 访问 为 连续 的 读 操作 时 ,该 存储 器 总 线 的 数据 传输 率 是 多 少 ? 

(3) 当 全 部 访问 为 连续 的 写 操作 时 ,该 存储 器 总 线 的 数据 传输 率 是 多 少 ? 

【分 析 解 答 】 

(1) 读 取 8 个 字 用 了 1 十 3 十 8=12 个 时 钟 周期 , 故 数据 传输 率 为 8&X4/(12X1/50) 天 
133. 3MB/s。 

(2) 写 入 8 个 字 用 了 1 十 2 十 8 十 3 二 14 个 时 钟 周期 , 故 数据 传输 率 为 8X4/(14X1/50)s 
114.3MB/s。 

(3) 可 用 两 种 方式 估算 。 若 用 数据 传输 率 加 权 平均 , 则 为 133.3X65 闪 十 114.3X35 狼 汪 
126.7MB/s; 若 用 时 钟 周期 数 加 权 平 均 , 则 为 8X4/((12 X65% 十 14 X 35%) X 1/50) 
126.0MB/s。 

8. 在 一 个 字 长 为 32 位 的 计算 机 系统 中 ,假定 存储 器 分 别 连接 以 下 两 种 不 同 的 同步 
总 线 。 

总 线 1 是 64 位 数据 和 地 址 复 用 的 总 线 。 能 在 一 个 时 钟 周期 中 传输 一 个 64 位 的 数据 或 
地 址 ,支持 最 多 连续 8 个 字 的 存储 器 读 和 存储 器 写 总 线 事务 。 任 何 一 次 读 写 操作 总 是 先 用 
一 个 时 钟 周期 传送 地 址 ,然后 有 两 个 时 钟 周期 的 延迟 等 待 ,从 第 4 时 钟 周期 开始 ,存储 器 准 
备 好 数据 ,总 线 以 每 个 时 钟 周期 两 个 字 的 速度 传送 ,最 多 传送 8 个 字 。 

总 线 2 是 分 离 的 32 位 地 址 和 32 位 数据 的 总 线 , 支 持 最 多 连续 8 个 字 的 存储 器 读 和 存 
储 器 写 总 线 事务 。 读 操作 过 程 为 : 一 个 时 钟 周期 传送 地 址 ,两 个 时 钟 周期 延迟 等 待 ,从 第 
4 时 钟 周期 开始 ,存储 器 准备 好 数据 ,总 线 以 每 时 钟 一 个 字 的 速度 传输 最 多 8 个 字 。 对 于 写 
操作 ,在 第 一 个 时 钟 周 期 内 第 一 个 数据 字 与 地 址 一 起 传输 ,经 过 两 个 时 钟 周期 的 延迟 等 待 
后 ,第 一 个 字 写 人 存储 器 ,并 在 后 面 7 个 时 钟 周期 中 ,以 每 个 时 钟 一 个 字 的 速度 最 多 传输 
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7 个 余下 的 数据 字 。 

假定 这 两 种 总 线 的 时 钟 频率 都 为 100MHz, 请 回答 下 列 问题 。 

(1) 两 种 总 线 的 最 大 数据 传输 率 ( 总 线 带 宽 ) 分 别 为 多 少 ? 

(2) 连续 进行 单个 字 的 存储 器 读 总 线 事务 时 ,两 种 总 线 的 数据 传输 率 分 别 是 多 少 ? 

(3) 连续 进行 单个 字 的 存储 器 写 总 线 事务 时 ,两 种 总 线 的 数据 传输 率 分 别 是 多 少 ? 

(4) 每 次 传输 8 个 字 的 数据 块 ,60% 是 读 操作 总 线 事务 ,40% 是 写 操作 总 线 事务 ,两 种 
总 线 的 数据 传输 率 分 别 是 多 少 ? 

(5) 通过 对 以 上 各 种 数据 的 分 析 对 比 , 给 出 相应 的 结论 。 

【分 析 解 答 】 

(1) 总 线 1 在 传送 数据 时 以 每 个 时 钟 周期 两 个 字 的 速度 进行 ,所 以 它 的 最 大 数据 传输 
率 为 32X2X100==6400Mb/s==800MB/s。 

总 线 2 在 传送 数据 时 以 每 个 时 钟 周期 一 个 字 的 速度 进行 ,所 以 它 的 最 大 数据 传输 率 为 
32X100=3200Mb/s=400MB/s。 

(2) 总 线 1 虽然 每 个 时 钟 周期 可 传 2 个 字 , 但 在 单字 传输 总 线 事务 中 每 次 只 需要 传送 
一 个 字 , 每 个 总 线 事务 占 1 十 2 十 1=4 个 时 钟 周期 ,因此 连续 进行 单个 字 的 存储 器 读 总 线 事 
务 时 ,总 线 1 的 数据 传输 率 为 4X100/4=100MB/s。 

总 线 2 每 个 时 钟 周期 读 一 个 字 , 一 个 单字 存储 器 读 总 线 事务 占 1 十 2 十 1 二 4 个 时 钟 周 
期 ,因此 连续 进行 单个 字 的 存储 器 读 总 线 事务 时 ,总 线 2 的 数据 传输 率 也 为 100MB/s。 

(3) 总 线 1 的 单字 存储 器 写 总 线 事务 和 单字 存储 器 读 总 线 事务 的 情况 一 样 ,因此 ,连续 
进行 单个 字 的 存储 器 写 总 线 事务 时 ,数据 传输 率 也 是 100MB/s。 

总 线 2 的 单字 存储 器 写 总 线 事务 占 1 十 2 二 3 个 时 钟 周期 ,因此 连续 进行 单个 字 的 存储 
器 写 总 线 事务 时 ,其 数据 传输 率 为 4X100/3=133. 3MB/s。 

(4) 通过 总 线 1 进行 存储 器 读 或 写 8 个 字 所 用 时 间 都 为 1 十 2 十 8/2=7 个 时 钟 周期 ,所 
以 在 连续 进行 多 个 8 字 突 发 传送 总 线 事务 时 ,总 线 1 的 数据 传输 率 为 8X4X100/7= 
457MB/s。 

总 线 2 的 存储 器 读 事务 和 存储 器 写 事务 所 用 时 间 不 等 , 突 发 读 8 个 字 所 用 的 时 间 为 
1 十 2 十 8 二 11 个 时 钟 周 期 , 突 发 写 8 个 字 所 用 的 时 间 为 1 十 2 十 7 二 10 个 时 钟 周期 ,因此 , 当 
60% 是 读 操 作 总 线 事务 ,40% 是 写 操作 总 线 事务 时 ,总 线 2 的 数据 传输 率 为 8X4X100/ 
11X60%% 十 8X4X100/10X40%s303MB/s。 

(5) 总 线 1 和 总 线 2 的 数据 线 和 地 址 线 总 数 都 是 64 位 ,总 线 1 采用 数据 /地 址 线 复 用 ， 
总 线 2 采用 分 离 的 数据 线 和 地 址 线 。 以 下 是 对 两 种 总 线 在 各 种 情况 下 的 分 析 以 及 得 出 的 
结论 。 

根据 (1) 中 对 两 种 总 线 最 大 数据 传输 率 的 计算 可 知 ,采用 数据 /地 址 线 复 用 技术 ,能 够 得 
到 更 大 的 峰值 数据 传输 率 。 因 为 ,一 旦 进入 到 数据 传输 阶段 ,用 64 位 数据 线 传输 数据 肯定 
比 用 32 位 数据 线 传输 数据 要 快 一 倍 。 

根据 (2) 和 (3) 中 对 两 种 总 线 在 单字 传输 情况 下 数据 传输 率 的 计算 可 知 ,采用 数据 /地 址 
线 分 离 技 术 , 可 以 得 到 更 大 的 单字 传输 数据 速率 。 因 为 ,单字 传输 时 ,数据 /地 址 线 复 用 时 得 
到 的 两 倍 宽度 的 数据 线 只 能 传送 一 个 字 , 同 时 ,由 于 信号 线 复 用 而 不 能 将 数据 和 地 址 同时 送 
出 ,使 得 写 事务 所 用 时 间 延 长 ,因而 ,采用 数据 /地 址 线 复 用 技术 的 情况 下 ,得 到 的 单字 传输 
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数据 速率 更 低 。 

根据 (4) 中 对 突 发 传送 8 个 数据 时 数据 传输 率 的 计算 可 知 ,采用 数据 /地 址 线 复 用 技术 ， 
能 够 得 到 更 大 的 突 发 数据 传输 率 。 因 为 在 突 发 传送 事务 中 需要 连续 传送 多 个 数据 ,此 时 ， 
64 位 数据 线 肯 定 比 32 位 数据 线 传 得 快 。 

9. 车 前 端 总 线 (FSB) 的 工作 频率 为 1333MHz( 实 际 时 钟 频率 为 333MHz) ,总 线 宽度 为 
64 位 , 则 总 线 带宽 为 多 少 ? 若 存储 器 总 线 为 三 通道 总 线 , 总 线 宽度 为 64 位 ,内 存 条 的 型 号 
为 DDR3-1333, 则 整个 存储 器 总 线 的 总 带宽 为 多 少 ? 若 内 存 条 型 号 改 为 DDR3-1066, 则 在 
储 器 总 线 的 总 带宽 是 多 少 ? 

【分 析 解 答 】 

前 端 总 线 工作 频率 为 1333MHz ,说明 总 线 上 每 秒 传送 1333M 次 数据 ,每 次 在 总 线 上 传 
送 64 位 ,因而 总 线 带宽 为 8X1333/1000s10. 664GB/s。 

若 内 存 条 型 号 为 DDR3-1333, 说 明 存储 器 总 线 的 工作 频率 为 1333MHz, 即 每 秒 传送 
1333M 次 数据 ,因而 每 个 通道 的 带宽 为 8BX1333/1000s:10. 66GB/s, 存 储 器 总 线 的 总 带宽 
为 3X10.66s32GB/s。 

若 内 存 条 型 号 为 DDR3-1066 ,说 明 存储 器 总 线 的 工作 频率 为 1066MHz, 即 每 秒 传送 
1066M 次 数据 ,因而 每 个 通道 的 带宽 为 8X1066/1000s8. 5GB/s, 因 此 存储 器 总 线 的 总 带 
宽 为 3X8.5=25. 5GB/s。 

10. 总 线 的 速度 通常 指 每 秒 钟 传输 多 少 次 ,例如 ,QPI 总 线 的 速度 单位 为 GT/s, 表 示 每 
秒 传输 多 少 个 10 亿 (1G==10) 次 。 若 QPI 总 线 的 时 钟 频率 为 2. 4GHz, 则 其 速度 为 多 少 ? 
总 带宽 是 多 少 ? QPI 总 线 的 速度 也 称 为 QPI 频率 , QPI 频率 为 6. 4GT/s 时 的 总 带宽 是 
多 少 ? 

【分 析 解 答 】 

QPI 总 线 是 一 种 基于 包 传 输 的 串 行 高 速 点 对 点 连接 协议 ,有 20 条 数据 线 , 其 中 16 位 是 
有 效 数据 ,4 位 用 于 CRC 校 验 ,发 送 方 (TX) 和 接收 方 (RX) 有 各 自 的 时 钟 信号 ,每 个 时 钟 周 
期 传输 两 次 数据 ,并 且 发 送 方 和 接收 方 可 以 同时 传输 ,因此 总 带宽 的 计算 公式 是 

每 秒 传输 次 数 X 每 次 传输 的 有 效 数据 X 2 

若 QPI 的 时 钟 频率 为 2. 4GHz, 则 速度 为 4. 8GT/s, 表 示 每 秒 钟 传输 4. 8G 次 数据 , 即 
QPI 频率 为 4.8GT/s。 此 时 总 带宽 是 4.8X2X2==19.2GB/s。QPI 频率 为 6. 4GT/s 时 的 
总 带宽 是 6. 4X2X2=25. 6GB/s。 

11. PCI-Express 总 线 采用 串 行 传输 方式 ,PCI-Express Xn 表示 具有 nn 个 通路 的 PCI- 
Express 链 路 。PCI-Express 1.0 规范 支持 通路 中 每 个 方向 的 发 送 或 接收 速率 为 2. 5Gb/s， 
则 PCI-ExpressX8 和 PCLExpressX32 的 总 带宽 分 别 为 多 少 ? 

【分 析 解 答 】 

PCI-Express 的 每 条 通路 由 发 送 和 接收 数据 线 构成 ,在 发 送 和 接收 两 个 方向 上 都 各 有 
两 条 差分 信号 线 , 可 同时 发 送 和 接收 数据 。 在 发 送 和 接收 过 程 中 ,每 个 数据 字 节 实际 上 被 转 
换 成 了 10 位 信息 被 传输 。PCLExpress 1. 0 规范 支持 通路 中 每 个 方向 的 发 送 或 接收 速率 为 
2.5Gb/s。 因 此 ,PCI-Express 1.0 总 线 的 总 带宽 计算 公式 (单位 为 GB/s) 是 

总 带宽 = 2.5 X 2 X 通 路 数 /10 
在 PCI-Express 1. 0 规范 下 , PCI-Express X 8 的 总 带宽 为 2. 5X2X8/10=4GB/s。 
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PCLExpressX32 的 总 带宽 为 16GB/s。 

12. 某 终 端 通过 RS-232 串 行 通信 接口 与 主机 相连 ,采用 起 止 式 异 步 通 信 方 式 , 若 传输 
速率 为 1200baud, 则 采用 两 相 调制 技 术 。 通 信 协 议 为 8 位 数据 、 无 校 验 位 ,停止 位 为 1 位 。 
请 回答 下 列 问题 : 

(1) 传送 一 个 字符 所 需 时 间 约 为 多 少 ? 

(2) 若 传输 速度 为 2400baud ,停止 位 为 2 位 ,其 他 条 件 不 变 , 则 传输 一 个 字符 的 时 间 约 
为 多 少 ? 

(3) 若 采用 四 相 调 制 技术 ,其 他 条 件 不 变 , 则 传输 一 个 字符 的 时 间 约 为 多 少 ? 

【分 析 解 答 】 

(1) 采用 两 相 调制 技术 ,比特 率 等 于 波 特 率 。1200baud 说 明 每 秒 传输 1200 个 信息 位 。 
每 个 字符 都 有 一 个 起 始 位 , 故 一 个 字符 有 1 十 8 十 1==10 位 ,因而 传输 一 个 字符 所 需 时 间 约 为 
10X (1/1200) X1000~8. 3ms。 

(2) 一 个 字符 有 1 十 8 十 2=11 位 ,传输 一 个 字符 所 需 时 间 约 为 11X (1/2400) X1000 坟 
4. 6ms。 

(3) 采用 四 相 调制 技术 , 则 每 个 码 元 调制 出 2 位 信息 ,因而 比特 率 为 波 特 率 的 两 倍 , 故 
传输 一 个 字符 所 需 时 间 约 为 10X(1/2400)X1000*4. 15ms。 

13. 假定 采用 独立 编 址 方式 对 1/O 端口 进行 编号 ,那么 ,必须 为 处 理 器 设计 哪些 指令 来 
专门 用 于 进行 1/O 端口 的 访问 ?连接 处 理 器 的 总 线 必须 提供 哪些 控制 信号 来 表明 访问 的 
是 1/O 空间? 

【分 析 解 答 】 

若 采 用 独立 编 址 方式 对 I/O 端口 进行 编号 , 则 主 存 地 址 编号 和 1/O 端口 编号 可 能 会 相 
同 ,所 以 ,无 法 利用 访 存 指令 来 访问 1/O 端口 ,必须 提供 专门 的 输入 输出 指令 ,包括 1/O 读 
指令 和 I/O 写 指令 。 在 执行 1/O 指令 时 ,CPU 会 送出 相应 的 1/0 读 和 1/0O 写 控 制 信号 ,以 
使 和 执行 访 存 指令 时 送出 的 存储 器 读 和 存储 器 写 信 号 有 所 区 别 。 

14. 假设 有 一 个 磁盘 ,每 面 有 200 个 磁道 ,盘面 总 存储 容量 为 1. 6MB(1M 王 10 ) ,磁盘 
旋转 一 周 时 间 为 25ms, 每 道 有 4 个 数据 区 ,每 两 个 数据 区 之 间 有 一 个 间隙 ,磁头 通过 每 个 
间隙 需 1.25ms。 请 回答 下 列 问题 ; 

(1) 从 该 磁盘 上 读 取 数 据 时 的 最 大 数据 传输 率 是 多 少 ? 

(2) 假如 有 人 为 该 磁盘 设计 了 一 个 与 主机 之 间 的 接口 ,如 图 8. 2 所 示 , 磁 盘 每 读 出 一 
位 , 串 行 送 入 一 个 移 位 寄存 器 ,每 当 移 满 16 位 后 向 处 理 器 发 出 一 个 请 求 交换 数据 的 信号 。 
在 处 理 器 响应 该 请 求 信号 并 读 取 移 位 寄存 器 内 容 的 同时 ,磁盘 继续 一 位 一 位 地 读 出 数据 并 
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图 8.2 题 14 中 的 示意 图 
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串 行 送 入 移 位 寄存 器 ,如 此 继续 工作 。 已 知 处 理 器 在 接 到 请 求 交换 的 信号 以 后 ,最 长 响应 时 
间 是 3ps, 那 么 这 样 设计 的 接口 能 否 正 确 工作 ? 车 不 能 , 则 应 如 何 改进 ? 

【分 析 解 答 】 

(1) 磁道 容量 为 1.6X10*/200=8000B, 数 据 区 容量 为 8000/4 王 2000B, 转 过 一 个 数据 
区 的 时 间 为 (25 一 1.25X4)/4 王 5ms, 因 而 磁盘 的 最 大 数据 传输 率 为 2000/(5/1000) 一 4 
105B/s 一 0.4MB/s。 

(2) 磁盘 传送 1 位 的 时 间 为 10:/(8X4X10)=0. 31ps 达 过 3ps。 因 为 传送 1 位 的 时 间 
小 于 3ps, 因 此 , 当 处 理 器 经 过 3ps 来 读 取 移 位 寄存 器 中 的 数据 时 ,磁盘 已 经 读 出 了 新 的 数 
据 位 ,并 将 原先 请 求 被 读 的 移 位 寄存 器 中 的 数据 冲刷 掉 了 。 显 然 ,这 样 的 设计 接口 不 能 正确 
工作 。 传 送 一 个 字 (16 位 ) 所 用 的 时 间 为 2/(4X105)==5ps 之 3ps, 所 以 可 以 在 磁盘 接口 中 增 
加 一 个 16 位 数据 缓冲 器 。 当 16 位 移 位 寄存 器 装 满 后 ,首先 送 入 数据 缓冲 寄存 器 ,在读 出 下 
一 个 16 位 数据 期 间 , 上 次 读 出 的 16 位 数据 从 数据 缓冲 器 中 被 取 走 。 

15. 假定 一 个 政府 机 构 同 时 监控 100 路 移动 电话 的 通话 消息 ,通话 消息 被 分 时 复 用 到 
一 个 带宽 为 4MB/s 的 网 络 上 ,100 路 复 用 使 得 每 传送 1IKB(1K 王 1024) 的 通话 消息 需 额 外 开 
销 150ps, 若 通话 消息 的 采样 频率 为 4kHz(lk=1000) ,每 个 样本 的 量化 值 占 16 位 。 请 回答 
下 列 问题 : 

(1) 要 求 计算 每 个 通话 消息 的 传输 时 间 , 并 判断 该 网 络 带 宽 能 否 同时 支持 监控 100 路 
通话 消息 。 

(2) 若 网 络 带 宽 降 为 1MB/s, 每 次 通话 消息 的 额外 开销 为 350ps, 则 该 系统 能 否 正确 
工作 ? 

【分 析 解 答 】 

(1) 该 网 络 传输 每 个 1KB 的 通话 消息 所 需 时 间 为 150 十 1024/(4X10°) X10 二 406ps。 
每 一 路 移动 电话 一 秒 钟 所 需 传输 的 数据 量 为 4000X2 二 8000B 二 7. 8125KB, 所 以 ,该 网 络 一 
秒 内 用 于 传输 100 路 移动 电话 所 需 时 间 为 100X406X7.8125s317ms<ls, 故 该 网 络 带宽 
可 同时 支持 监控 100 路 通话 消息 。 

(2) 每 一 路 移动 电话 一 秒 所 需 传输 的 数据 量 为 4000X2==8000B=7. 8125KB,100 个 移 
动 电话 在 一 秒 钟 内 产生 的 数据 量 为 100X7. 8125 二 781. 25KB, 每 个 通话 消息 为 1KB, 所 以 ， 
每 秒 共产 生 781 个 消息 。 如 果 不 考虑 额外 开销 带 来 的 延迟 ,那么 ,每 秒 产生 781KB 的 信息 
量 在 带宽 为 1MB/s 的 网 络 上 传输 是 没有 问题 的 。 

但 是 ,由 于 多 路 复 用 带 来 了 额外 开销 ,使 得 该 网 络 传输 每 个 1KB 的 通话 消息 所 需 时 间 
为 350 十 1024/(1X105) X10 二 1374ys 二 1. 374ms。 所 以 一 秒 内 网 络 上 能 够 传输 的 消息 最 
多 只 能 有 1000/1. 374 王 740 个 ,而 100 个 移动 电话 在 一 秒 内 共产 生 了 781 个 消息 (所 需 时 间 
为 781X1.374s*1070ms>1s) ,所 以 系统 不 能 正确 工作 。 

16. 假定 一 台 计 算 机 带 有 20 个 终端 同时 工作 ,在 运行 用 户 程 序 的 同时 ,能 接收 来 自任 
意 一 个 终端 输入 的 字符 信息 ,并 将 字符 回 送 显示 或 打印 。 每 一 个 终端 的 键盘 输入 部 分 有 一 
个 数据 缓冲 寄存 器 RDBR;(i 二 1~20), 当 在 键盘 上 按 下 某 一 个 键 时 ,相应 的 字符 代码 即 进 
入 RDBR; ,并 使 它 的 “完成 ”状态 标志 Done; (i 二 1~20) 置 1, 要 等 处 理 器 把 该 字符 代码 取 走 
后 ,Done; 标志 才 自 动 清 零 (复位 )。 每 个 终端 显示 或 打印 输出 部 分 也 有 一 个 数据 缓冲 寄存 
器 TDBR;(i 二 1~20) ,并 有 一 个 Ready;(i 二 1~20) 状 态 标 志 , 该 状态 标志 为 1 时 ,表示 相应 
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的 TDBR; 是 空 着 的 ,准备 接收 新 的 输出 字符 代码 , 当 TDBR; 接收 了 一 个 字符 代码 后 ， 
Readyi 标志 自动 清 零 ,并 将 字符 送 终端 显示 或 打印 。 为 了 接收 终端 的 输入 信息 ,处 理 器 为 
每 个 终端 设计 了 一 个 指针 PTR;(G=1 一 20) 指 向 为 该 终端 保留 的 主 存 输入 缓冲 区 。 处 理 器 
采用 下 列 两 种 方案 输入 键盘 代码 ,同时 回 送 显示 或 打印 。 

(1) 每 隔 一 固定 时 间 人 转 和 人 一 个 状态 检查 程序 DEVCHC ,顺序 地 检查 全 部 终端 是 否 有 
任何 键盘 信息 输入 ,如 果 有 , 则 顺序 完成 之 。 

(2) 允许 任何 有 键盘 信息 输入 的 终端 向 处 理 器 发 出 中 断 请 求 。 全 部 终端 采用 共同 的 向 
量 地 址 ,利用 它 使 处 理 器 在 响应 中 断后 , 转 入 一 个 中 断 服务 程序 DEVINT, 由 后 者 询问 各 终 
端 状 态 标志 ,并 为 最 先 遇 到 的 有 中 断 请 求 的 终端 服务 ,服务 结束 后 返回 用 户 程序 。 

要 求 画 出 DEVCHC 和 DEVINT 两 个 程序 的 流程 图 。 

【分 析 解 答 】 

定时 查询 程序 DEVCHC 和 中 上 断 服务 程序 DEVINT 的 流程 分 别 如 图 8. 3 和 图 8.4 所 
示 。 图 中 用 (x) 表 示 x 的 内 容 ,x 可 能 是 存储 单元 地 址 或 寄存 器 编号 。 此 外 ,因为 标志 Done; 
和 Ready; 由 硬件 控制 自动 清 零 (复位 ), 所 以 ,流程 图 中 没有 对 这 两 个 标志 赋值 的 操作 。 程 
序 DEVINT 的 流程 图 中 ,如 果 所 有 终端 都 检测 不 到 Done 标志 为 1 ,说 明 所 有 终端 都 没有 键 
盘 输入 ,也 即 都 没有 中 断 请 求 ,此 时 不 应 该 进入 DEVINT 处 理 , 因 此 需 报告 “出 错 ”。 
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图 8.3 定时 查询 程序 DEVCHC 的 处 理 流程 


17. 若 某 计算 机 中 断 系统 有 5 个 中 断 源 , 分 别 记 为 1.2、3、4 和 5, 其 中 断 响应 优先 级 为 
1>>2>>3>>4>5, 而 中 断 处 理 优 先 级 为 1>4 之 5 之 2 之 3。 要 求 ， 

(1) 设计 各 级 中 断 服务 程序 的 中 断 屏 项 位 (假设 1 为 屏蔽 ,0 为 开放 ) 。 

(2) 若 在 运行 用 户 程序 时 ,中 断 源 2 和 4 同时 发 生 中 断 请 求 ,而 在 处 理 2 号 中 断 源 的 过 
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8.4 中 断 服 务 程序 DEVINT 的 处 理 流程 


程 中 ,中 断 源 1.3 和 5 同时 发 生 中 断 请 求 , 试 画 出 此 时 CPU 运行 过 程 示 意图 。 

【分 析 解 答 】 

(1) 由 题 意 可 知 ,中 断 源 1 的 处 理 优先 级 最 高 ,说 明 1 号 中 断 源 对 其 他 所 有 中 断 源 都 屏 
蔽 ,其 屏蔽 字 为 全 1;3 号 中 断 源 的 处 理 优先 级 最 低 ,所 以 除了 3 号 中 断 源 之 外 ,对 其 他 中 断 
源 全 都 开放 ,其 屏蔽 字 为 00100。 以 此 类 推 ,得 到 所 有 各 个 中 断 源 的 中 断 服 务 程序 中 设置 的 
中 断 屏蔽 字 如 表 8. 1 所 示 。 


表 8.1 题 17 中 的 中 断 屏蔽 字 




















中 断 屏蔽 字 
中 断 处 理 程序 
第 1 号 第 2 号 第 3 号 第 4 号 第 5 号 
第 1 号 1 1 1 1 | 
第 2 号 0 1 1 0 0 
第 3 号 0 0 1 0 0 
第 4 号 0 1 1 1 1 
第 5 号 0 1 1 0 i 

















(2) 在 运行 用 户 程序 时 ,同时 出 现 中 断 源 2 和 4, 因为 用 户 程序 对 所 有 中 断 源 都 开放 ,所 
以 ,在 中 断 响 应 优先 级 排队 电路 中 ,中 断 源 2 和 4 进行 排队 判 优 ,根据 中 断 响 应 优先 级 
2>4, 因 此 先 响应 2 号 中 断 源 。 在 CPU 执行 中 断 源 2 的 中 断 服务 程序 过 程 中 ,首先 保护 现 
场 ,保护 旧 屏蔽 字 、 设 置 新 的 屏蔽 字 01100, 然 后 ,在 具体 中 断 处 理 前 先 开 中 断 。 一 旦 开 中 
断 , 则 马上 响应 4 号 中 断 源 , 因 为 第 2 号 的 中 断 屏蔽 字 中 对 第 4 号 中 断 源 的 屏蔽 位 是 0, 也 
即 对 第 4 号 中 断 源 是 开放 的 。 在 第 4 号 中 断 处 理 结束 后 , 回 到 第 2 号 中 断 源 的 中 断 服务 程 
序 执行 ;在 具体 处 理 第 2 号 中 断 过 程 中 ,同时 发 生 了 第 1、3、5 号 中 断 源 请 求 , 因 为 第 2 号 中 
断 对 第 1.5 号 中 断 开放 ,对 第 3 号 中 断 屏蔽 ,所 以 只 有 第 1 和 第 5 两 个 中 断 源 进行 排队 判 


地 co 测 


计算 机 组 成 与 系统 结 药 习题 解答 和 我 学 指 时 (第 2 版 ) 





优 ,根据 中 断 响应 优先 级 1>5, 所 以 先 响应 第 1 号 中 断 源 。 因 为 第 1 号 中 断 处 理 优先 级 最 
高 ,所 以 在 其 处 理 过 程 中 不 会 响应 任何 新 的 中 断 请 求 , 直 到 第 1 号 中 断 处 理 结束 ,然后 返回 
第 2 号 中 断 ; 因 为 第 2 号 中 断 对 第 5 号 中 断 开放 ,所 以 在 第 2 号 中 断 服务 程序 中 执行 一 条 指 
令 后 ,又 转 去 执行 第 5 号 中 断 服务 程序 ,执行 完 后 回 到 第 2 号 中 断 , 在 第 2 号 中 断 服务 程序 
执行 过 程 中 ,虽然 第 3 号 中 断 有 请 求 ,但 是 ,因为 第 2 号 中 断 对 第 3 号 中 断 不 开放 ,所 以 ,第 
3 号 中 断 一 直 得 不 到 响应 。 直 到 第 2 号 中 断 处 理 完 回 到 用 户 程 序 , 才 能 响应 并 处 理 第 3 号 
中 断 。CPU 运行 过 程 如 图 8. 5 所 示 。 
中 断 服务 程序 5 ----------------- 一 一 ------------------ 


中 断 服务 程序 -一 -了 一 一 1 一- 
1 1 

中 断 服务 程序 3 一 i 
1 1 


1 
中 服务 和 -LT 一- -一 二 一 一- 
1 1 
中 电 服 务 程序 | -十 ------- L | 上 | 
人 
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8.5 CPU 运行 程序 的 执行 轨迹 
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18. 某 计算 机 的 CPU 主 频 为 500MHz, 所 连接 的 某 外 设 的 最 大 数据 传输 率 为 20kB/s， 
该 外 设 接口 中 有 一 个 16 位 的 数据 缓存 器 ,相应 的 中 断 服务 程序 的 执行 时 间 为 500 个 时 钟 周 
期 。 请 回答 下 列 问题 : 

(1) 是 否 可 用 中 断 方式 进行 该 外 设 的 输入 输出 ? 若 能 ,在 该 设备 持续 工作 期 间 ,CPU 
用 于 该 设备 进行 输入 输出 的 时 间 占 整个 CPU 时 间 的 百分比 大 约 为 多 少 ? 

(2) 若 该 外 设 的 最 大 数据 传输 率 是 2MB/s, 则 可 和 否 用 中 断 方式 进行 输入 输出 ? 

【分 析 解 答 】 

(1) 因为 该 外 设 接口 中 有 一 个 16 位 数据 缓存 器 ,所 以 , 若 用 中 断 方式 进行 输入 输出 ,可 
以 每 16 位 数据 进行 一 次 中 断 请 求 ,因此 ,中 断 请求 的 时 间 间 隔 为 10 X2/(20X107) 一 
100ps。 

对 应 的 中 断 服务 程序 的 执行 时 间 为 105/(500X10*)X500= lys, 因 为 中 断 响应 过 程 就 
是 执行 一 条 隐 指 令 的 过 程 ,所 用 时 间 相 对 于 中 断 处理 时 间 ( 即 执行 中 断 服务 程序 的 时 间 ) 而 
言 , 几 乎 可 以 忽略 不 计 , 因 而 整个 中 断 响 应 并 处 理 的 时 间 大 约 lws 多 一 点 , 远 远 小 于 中 断 请 
求 的 间隔 时 间 。 因 此 ,可 以 用 中 断 方式 进行 该 外 设 的 输入 输出 。 

若 用 中 断 方式 进行 该 设备 的 输入 输出 , 则 该 设备 持续 工作 期 间 ,CPU 用 于 该 设备 进行 
输入 输出 的 时 间 占 整个 CPU 时 间 的 百分比 大 约 为 1/100==1%。 也 可 以 通过 考察 1 秒 内 
500M 个 时 钟 周期 中 有 多 少时 钟 周期 用 于 中 断 来 计算 百分比 ,其 计算 公式 为 (10°/100 xX 
500)/(500X10)=1%, 

(2) 若 外 设 的 最 大 传输 率 为 2MB/s, 则 中 断 请 求 的 时 间 间 隔 为 10 X2/(2X10)=1ps。 
而 整个 中 断 响 应 并 处 理 的 时 间 大 约 lws 多 一 点 ,中 断 请 求 的 间隔 时 间 小 于 中 断 响应 和 处 理 
时 间 , 也 即 中 断 处 理 还 未 结束 就 会 有 该 外 设 新 的 中 断 到 来 ,所 以 不 可 以 用 中 断 方式 进行 该 外 
设 的 输入 输出 。 
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19. 假设 某 计算 机 中 软盘 以 中 断 方式 进行 数据 输入 输出 ,每 次 中 断 请 求 传输 一 个 32 位 
数 ,已 知 软盘 的 数据 传输 率 为 500kB/s, 每 次 传输 的 CPU 开销 (包括 中 断 响应 和 处 理 ) 为 
1000 个 时 钟 周期 ,CPU 的 主 频 为 500MHz, 则 软盘 在 持续 工作 时 ,CPU 用 于 软盘 数据 传送 
的 时 间 占 CPU 整个 时 间 的 百分比 是 多 少 ? 

【分 析 解 答 】 

软盘 准备 32 位 数据 的 时 间 为 10 X4/(500X103)=8ps。 因 此 ,软盘 每 隔 8ps 发 一 次 中 
断 请 求 ,CPU 响应 并 处 理 中 断 所 用 时 间 为 1000X1051(500X105) 一 25s, 因 此 ,每 次 CPU 花 
2us 取 走 数据 后 ,就 去 执行 其 他 程序 ;过 8ps 后 软盘 又 准备 好 下 一 个 数据 ,又 发 中 断 请 求 ， 
CPU 响应 并 处 理 中 断 以 取 走 数据 ,然后 又 去 执行 其 他 程序 …… 如 此 周而复始 ,直到 所 有 需 
要 的 数据 传送 完 。 因 此 , 当 软 盘 持 续 工 作 时 ,CPU 用 于 软盘 数据 传送 的 时 间 占 CPU 总 时 间 
的 百分比 是 2/8==25%。 

20. 某 计 算 机 CPU 主 频 为 550MHz,CPI 为 5。 假定 某 外 设 的 数据 传输 率 为 0.5MB/s， 
采用 中 断 方式 与 主机 进行 数据 传送 ,传输 单位 为 32 位 ,对 应 的 中 断 服务 程序 包含 18 条 指 
令 , 中 断 响应 等 其 他 开销 相当 于 2 条 指令 的 执行 时 间 。 请 回答 下 列 问 题 ,要 求 给 出 计算 
过 程 。 

(1) 在 中 断 方式 下 ,CPU 用 于 该 外 设 1/0 的 时 间 占 整个 CPU 时 间 的 百分比 是 多 少 ? 

(2) 当 该 外 设 的 数据 传输 率 达 到 5MB/s 时 , 改 用 DMA 方式 传送 数据 。 假 定 每 次 
DMA 传送 的 块 大 小 为 5000B, DMA 预 处 理 和 后 处 理 的 总 开销 为 500 个 时 钟 周期 , 则 CPU 
用 于 该 外 设 1/O 的 时 间 占 整个 CPU 时 间 的 百分比 是 多 少 ? (假设 DMA 与 CPU 之 间 没 有 
访 存 冲突 。) 

【分 析 解 答 】 

(1) 中 断 方式 下 ,每 当 外 设 准 备 好 32 位 数据 ( 读 操 作 ) 或 外 设 接口 中 的 32 位 数据 缓存 
为 空 已 准备 好 接收 新 数据 ( 写 操 作 ) 时 ,就 向 CPU 发 中 断 申请 ,要 求 CPU 通过 执行 中 断 服 
务 程序 来 取 走 缓存 中 的 32 位 数据 或 向 缓存 送 32 位 数据 。CPU 每 次 执行 中 断 服务 程序 花 
8 条 指令 的 时 间 , 其 他 如 中 断 响 应 等 的 开销 相当 于 2 条 指令 的 时 间 ,CPI 为 5。 因此 ,每 次 
CPU 用 于 中 断 处 理 (数据 传送 服务 ) 的 时 钟 周期 数 为 5X18 十 5X2=100。 外 设 的 数据 传输 
率 为 0.5MB/s, 每 次 中 断 传 送 32 位 数据 , 占 4B, 因 此 ,外 设 每 秒 申 请 的 中 断 次 数 为 0. 5 X 
05/4 二 125000, 因 而 每 秒 内 CPU 用 于 中 断 响应 和 处 理 的 时 间 开 销 为 100 X 125000 = 
2500000 二 12. 5M 个 时 钟 周期 ,CPU 的 时 钟 频 率 为 500MHz, 即 CPU 每 秒 产生 500M 个 时 
钟 周期 , 故 CPU 用 于 外 设 1/O 的 时 间 占 整个 CPU 时 间 的 百分比 为 (12. 5 Xx 10°)/(500X 
05) 二 2.5%。 也 可 通过 考查 相 邻 两 次 中 断 请 求 间隔 时 间 内 CPU 用 于 中 断 的 时 间 来 计算 ， 
即 (100X1/(500X105))/(4B/(0.5X105))=2.5%。 

(2) 当 外 设 数 据 传输 率 提高 到 5MB/s 时 ,一 秒 内 产生 的 DMA 次 数 为 5X 105/5000= 
000; 每 次 DMA 传送 前 都 需要 进行 DMA 初始 化 ( 预 处 理 ) ,DMA 结束 后 还 要 进行 中 断 处 
理 (后 处 理 ) ,已 知 这 两 个 处 理 总 共 需 要 500 个 时 钟 周期 ,所 以 ,CPU 用 于 DMA 处 理 的 总 开 
销 为 1000X500 二 500000 二 0. 5M 个 时 钟 周期 ;而 CPU 的 时 钟 频 率 为 500MHz, 即 CPU 每 
秒 钟 内 产生 500M 个 时 钟 周期 , 故 CPU 用 于 该 外 设 IVO 的 时 间 占 整个 CPU 时间 的 百分比 
为 (0.5X10)/(500X105) 二 0.1%。 也 可 通过 考察 相 邻 两 次 DMA 请 求 间隔 时 间 内 CPU 
用 于 该 外 设 1/O 的 时 间 来 计算 , 即 (500X1/(500X105))/(5000B/(5X10))=0.1%。 
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21. 某 计算 机 字 长 16 位 ,没有 cache, 运 算 器 一 次 定点 加 法 时 间 等 于 100ns, 配 置 的 磁盘 
旋转 速度 为 每 分 3000 转 ,每 个 磁道 上 记录 两 个 数据 块 ,每 一 块 有 8000B, 两 个 数据 块 之 间 间 
隙 的 越过 时 间 为 2ms, 主 存 存储 周期 为 500ns, 存 储 器 总 线 宽度 为 16 位 。 

(1) 磁盘 读 写 数据 时 的 最 大 数据 传输 率 是 多 少 ? 平均 数据 传输 率 是 多 少 ? 

(2) 若 磁盘 按 最 大 数据 传输 率 与 主 存 交 换 数据 时 CPU 没有 访问 主 存 , 则 此 时 主 存 频 带 
空闲 百分比 是 多 少 ? 

(3) 直接 寻 址 的 “存储 器 一 存储 器 ”SS 型 加 法 指令 在 无 磁盘 1/O 操作 打扰 时 的 执行 时 
间 为 多 少 ? 此 时 , 主 存 频带 空闲 百分比 是 多 少 ? 当 磁 盘 I/O 操作 与 一 连 串 这 种 SS 型 加 法 
指令 执行 同时 进行 时 ,这 种 SS 型 加 法 指令 的 最 快 和 最 慢 执 行 时 间 各 是 多 少 ? (假定 采用 多 
周期 处 理 器 方式 ,CPU 时 钟 周期 等 于 主 存 周期 。) 

【分 析 解 答 】 

(1) 磁盘 旋转 一 周 所 需 时 间 为 60X103/3000=20ms, 单 个 数据 块 的 传输 时 间 为 20/2 一 
2=8ms, 所 以 最 大 数据 传输 率 为 8000/(8/10:)=1MB/s。 平 均 数 据 传输 率 为 2X8000/(20/ 
103) 一 0.8MB/s。 

(2) 磁盘 最 大 数据 传输 率 为 1MB/s, 存 储 器 总 线 宽度 为 16b 二 2B, 故 每 隔 10" X2/(1X 
10) 二 2000ns 产生 一 个 DMA 请 求 , 即 每 2000/500=4 个 主 存 周 期 中 有 一 个 被 DMA 挪用 ， 
此 时 ,CPU 没有 访问 主 存 ,因此 ,4 个 主 存 周 期 中 有 3 个 空闲 , 故 主 存 频带 空闲 百分比 是 
75% ,如 图 8.6 所 示 。 图 中 箭头 处 开始 的 一 个 主 存 周期 被 DMA 挪用 。 


一 -一 -全 一 一 一 二 二 一 上 一 -会 - 
| | | 


图 8.6 无 CPU 访 存 时 主 存 周期 被 DMA 使 用 的 情况 


(3) 无 I/O 打扰 时 ,执行 一 条 直接 寻 址 的 SS 型 加 法 指令 的 过 程 如 图 8.7 所 示 , 包 括 取 
指令 、 取 源 操作 数 1、 取 目的 操作 数 ( 源 操作 数 2) ,执行 、 写 结果 ,因此 执行 时 间 为 5X500= 
2500ns 二 2.5 ps。 此 时 ,每 个 指令 周期 所 包含 的 5 个 时 钟 周期 中 ,只 有 执行 阶段 不 访问 主 
存 , 所 以 主 存 频带 空闲 百分比 是 20%。 


EGGHG+H 一 全 HIGIGH 全 | 全 |GIG 合 -一 


8.7 无 I/O 打扰 时 主 存 周期 被 CPU 使 用 的 情况 


当 磁 盘 1/O 操作 与 一 连 串 这 种 SS 型 加 法 指令 同时 进行 时 ,可 能 因为 CPU 和 DMA 同 
时 访 存 而 使 指令 的 执行 时 间 被 延长 。 每 次 DMA 请 求 要 求 挪用 一 个 主 存 周期 来 访问 主 存 ， 
同时 ,CPU 执行 指令 时 也 要 求 访问 主 存 , 当 两 者 发 生 冲 突 时 ,DMA 优先 级 高 ,CPU 的 访 存 
请 求 被 延迟 。 因 为 每 隔 2000ns 产生 一 个 DMA 请 求 , 因 此 每 4 个 主 存 周期 必定 有 一 个 被 
DMA 所 挪用 。 此 时 , 主 存 周期 的 占用 情况 如 图 8. 8 所 示 。 

由 图 8. 8 可 知 , 最 好 的 情况 是 在 SS 型 加 法 指令 执行 过 程 中 没有 访 存 冲突 (如 图 8. 8 中 
最 开始 的 一 个 指令 周期 ) ,此 时 最 快 ,指令 执行 时 间 为 2. 5us; 最 坏 的 情况 是 有 一 次 访 存 冲 突 
(如 图 8. 8 中 第 二 个 指令 周期 ) ,此 时 最 慢 ,指令 执行 时 间 为 2.5 十 500/10 二 3ps。 

22. 某 计算 机 所 有 指令 都 可 用 两 个 总 线 周期 完成 ,一 个 总 线 周期 用 来 取 指令 , 男 一 个 总 
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图 8.8 CPU 和 DMA 交 蔡 串 行 访 问 主 存 时 的 情况 


线 周 期 用 来 存 取 数 据 。 假 定 总 线 宽度 为 8 位 ,每 个 总 线 周 期 为 250ns, 因 而 每 条 指令 的 执行 
时 间 为 500ns。 若 该 计算 机 中 配置 的 磁盘 每 个 磁道 有 16 个 512B 的 扇 区 ,磁盘 旋转 一 圈 的 
时 间 是 8. 192ms。 请 回答 下 列 问 题 。 

(1) 在 磁盘 不 工作 时 , 主 存 频带 空闲 百分比 是 多 少 ? 

(2) 若 采 用 周期 挪用 法 进行 DMA 传送 , 则 该 计算 机 执行 指令 的 速度 由 于 DMA 传送 而 
降低 了 多 少 ? 

(3) 若 采 用 周期 挪用 法 进行 DMA 传送 ,总 线 宽度 改 为 16 位 , 则 该 计算 机 执行 指令 的 
速度 由 于 DMA 传送 而 降低 了 多 少 ? 

【分 析 解 答 】 

(1) 因为 所 有 指令 的 每 个 阶段 都 要 访问 主 存 , 所 以 即使 没有 磁盘 访问 主 存 ,CPU 也 把 
主 存 周期 占 满 了 。 因 此 , 主 存 频带 空闲 百分比 是 0。 

(2) 磁盘 的 平均 数据 传输 率 为 10; X16 X512B/8. 192 二 1000000B/s 二 1MB/s。 当 总 线 
位 宽 为 8 位 时 ,DMA 控制 器 每 隔 1/(1X105)=10-5s 一 lps 申请 一 次 数据 传送 ,在 1ps 期 间 
CPU 共 执 行 1/(500/103)=2 条 指令 。 因 此 ,每 两 条 指令 的 执行 被 插入 一 个 总 线 周期 用 于 
一 次 数据 传送 ,也 即 平均 每 条 指令 延长 了 250/2=125ns。 因 而 ,计算 机 执行 指令 的 速度 降 
低 了 125/500 王 25%% 。 

(3) 当 总 线 位 宽 为 16 位 时 ,DMA 控制 器 每 隔 2/(1X10’)=2X10-*s=2ps 申请 一 次 
数据 传送 ,在 2ps 期 间 CPU 共 执行 2/(500/103) =4 条 指令 ,因此 ,每 4 条 指令 的 执行 被 插 
人 一 个 总 线 周 期 用 于 一 次 数据 传送 ,也 即 平均 每 条 指令 延长 了 250/4 二 62. 5ns。 因 而 ,计算 
机 执行 指令 的 速度 降低 了 62. 5/500=12.5%。 

23. 假设 一 个 主 频 为 1GHz、CPI 为 5 的 CPU 需要 从 某 个 成 块 传送 的 I/O 设备 读 取 
1000B 的 数据 到 主 存 缓冲 区 中 ,该 1/0 设备 一 旦 启动 即 按 50kB/s 的 数据 传输 率 向 主机 传送 
1000B 数据 ,每 个 字 节 的 读 取 、 处 理 并 存 人 内 存 缓冲 区 需要 1000 个 时 钟 周期 , 则 以 下 4 种 方 
式 下 ,在 1000B 的 读 取 过 程 中 ,CPU 用 在 该 设备 的 1/0 操作 上 的 时 间 分 别 为 多 少 ? 占 整 个 
CPU 时 间 的 百分比 分 别 是 多 少 ? 

(1) 采用 定时 查询 方式 ,每 次 处 理 一 个 字 节 ,一 次 状态 查询 至 少 需 要 60 个 时 钟 周期 。 

(2) 采用 独占 查询 方式 ,每 次 处 理 一 个 字 节 ,一 次 状态 查询 至 少 需 要 60 个 时 钟 周期 。 

(3) 采用 中 断 I/O 方式 ,外 设 每 准备 好 一 个 字 节 发 送 一 次 中 断 请 求 。 每 次 中 断 响应 需 
要 2 个 时 钟 周期 ,中 断 服务 程序 的 执行 需要 1200 个 时 钟 周 期 。 

(4) 采用 周期 挪用 DMA 方式 ,每 挪用 一 次 主 存 周期 处 理 一 个 字 节 , 一 次 DMA 传送 完 
成 1000B 的 传送 ,DMA 初始 化 和 后 处 理 的 时 间 为 2000 个 时 钟 周期 ,CPU 和 DMA 之 间 没 
有 访 存 冲突 。 
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(5) 如 果 设备 的 速度 提高 到 5MB/s, 则 上 述 4 种 方式 中 ,哪些 是 不 可 行 的 ? 为 什么 ? 对 
于 可 行 的 方式 ,计算 出 CPU 在 该 设备 I/O 操作 上 所 用 的 时 间 占 整个 CPU 时 间 的 百分比 。 

(6) 如 果 外 设 不 是 成 块 传送 设备 ,而 是 字符 型 设备 ,CPU 每 处 理 完 一 个 字 节 后 都 要 重 
新 启动 外 设 , 外 设 在 启动 后 0.02ms 时 间 准 备 好 一 个 字 节 。 每 个 字 节 的 读 取 、 处 理 ( 包 括 启 
动 下 次 操作 ) 并 存 人 内 存 缓冲 区 还 是 需要 1000 个 时 钟 周期 ,假定 CPU 总 是 在 查询 到 就 绪 后 
立即 启动 外 设 或 在 中 断 服务 程序 执行 了 20 条 指令 后 启动 外 设 , 则 在 (1) 一 (3) 三 种 方式 下 ， 
CPU 在 该 设备 的 IO 操作 上 所 用 的 时 间 占 整个 CPU 时 间 的 百分比 分 别 是 多 少 ? 

(7) 根据 对 以 上 各 种 数据 进行 分 析 , 你 可 以 得 出 哪些 结论 ? 

【分 析 解 答 】 

主 频 为 1GHz, 所 以 ,时 钟 周期 为 1/(1X10?) 王 10-9s 一 lns。 因 为 每 个 字 节 的 读 取 、 处 
理 并 存 人 内 存 缓冲 区 需要 1000 个 时 钟 周期 ,所 以 ,对 于 像 程序 查询 和 中 断 等 用 软件 实现 输 
入 输出 的 方式 ,CPU 为 每 个 字 节 传送 所 用 的 时 间 至 少 为 1000X1=1000ns=1lns。 在 50kB/ 
s 的 数据 传输 率 下 ,设备 每 隔 1/(50 X10 ) 二 2X10“s 二 20ps 准备 好 一 个 字 节 , 因 而 读 取 
1000B 的 时 间 为 1000X20==20000ps 二 20ms。 

(1) 定时 查询 方式 下 的 1/O 过 程 如 图 8. 9 所 示 。 可 以 设置 每 隔 20000ns 查询 一 次 ,这 
样 使 得 查询 程序 的 开销 达到 最 小 , 即 第 一 次 读 取 状 态 时 就 可 能 会 发 现 就 绪 ,然后 用 1000 个 
时 钟 周期 进行 相应 处 理 ,因此 ,对 于 每 个 字 节 的 传送 ,CPU 所 用 时 钟 周期 数 为 60 十 1000= 
1060。 因 此 ,在 1000B 的 读 取 过 程 中 ,CPU 用 在 该 设备 的 1/0 操作 上 的 时 间 至 少 为 1000X 
1060X1=1.06X10sns 王 1.06ms, 占 整个 CPU 时间 的 百分比 至 少 为 1.06/20=5. 3%。 
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查询 就 绪 就 绪 


图 8.9 定时 查询 方式 下 的 I/O 过程 


(2) 独占 查询 方式 下 的 1/O 过 程 如 图 8. 10 所 示 。 启 动 设备 后 ,CPU 就 开始 查询 ,因为 
333X60 十 20 王 20000, 所 以 第 一 个 字 节 传送 在 第 334 次 读 取 状 态 查询 时 检测 到 就 绪 , 随 后 用 
1000 个 时 钟 周期 进行 相应 的 处 理 , 然 后 继续 第 二 个 字 节 的 状态 查询 ,因为 40 十 1000 十 316X 
60 二 20000, 所 以 ,第 二 个 字 节 的 传送 在 第 316 次 读 取 状态 查询 时 检测 到 就 绪 , 第 一 个 和 第 二 
个 字 节 的 传送 过 程 如 图 8. 10(a) 所 示 。 每 次 检测 到 就 绪 后 ,就 进行 相应 的 处 理 ,然后 周 而 复 
始 地 进行 查询 ,因为 (20000 一 1000)/60s*316.7, 所 以 ,第 317 次 状态 查询 时 发 现 就 绪 。 因 为 
1000 十 60X317 一 20000= 二 20, 所 以 ,每 3B 可 多 60 个 时 钟 周期 ,正好 进行 一 次 状态 查询 , 因 
此 ,在 剩 下 的 998B 的 读 取 过 程 中 ,前 996B 的 传送 正好 用 了 996 X 20000 个 时 钟 周期 ,如 
图 8.10(b) 所 示 。 最 后 两 个 字 节 的 传送 过 程 如 图 8. 10(c) 所 示 , 因 为 2X (1000 十 60X317 一 
20000) 二 40, 此 外 ,最 后 一 个 字 节 的 处 理 还 有 1000 个 时 钟 周期 ,所 以 最 后 两 个 字 节 总 的 时 间 
为 2X20000 十 40 十 1000 二 41040 个 时 钟 周期 。 综 上 所 述 ,CPU 用 在 该 设备 的 1/O 操作 上 的 
总 时 间 为 (1000X20000 十 1040)X1=2000104ns 王 20.00104mss*20ms。 即 在 1000B 的 整个 
传输 过 程 中 ,CPU 一 直 为 该 设备 服务 ,所 用 时 间 占 整个 CPU 时 间 的 100%。 

(3) 中 断 方式 下 的 1/O 过程 如 图 8. 11 所 示 。 中 断 方式 下 ,外 设 每 准备 好 一 个 字 节 请 求 
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(0) 最 后 两 个 字 节 的 查询 过 程 
8.10 独占 查询 方式 下 的 I/O 过 程 


一 次 中 断 ,每 次 中 断 CPU 所 用 时 钟 周期 数 为 2 十 1200 二 1202, 因 此 CPU 用 在 该 设备 的 IO 
操作 上 的 时 间 为 1000X1202X1=1202000ns 二 1.202ms, 占 整个 CPU 时 间 的 百分比 至 少 为 
1.202/20=6. 01%。 
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8.11 中 断 方式 下 的 I/O 过 程 


(4) DMA 方式 下 ,由 于 CPU 和 DMA 没有 访 存 冲突 ,所 以 不 需 考虑 由 于 DMA 而 影响 
到 CPU 执行 其 他 程序 。 因 此 ,CPU 传送 1000B 所 用 的 时 钟 周期 数 就 是 2000, 在 1000B 的 
读 取 过 程 中 ,CPU 用 在 该 设备 的 1/0 操作 上 的 时 间 为 2000X1=2000ns==2ps, 占 整个 CPU 
时 间 的 百分比 为 2/(1000X20)=0.01%。 

(5) 若 设 备 数据 传输 率 为 5MB/s, 则 外 设 传输 1000B 所 用 时 间 为 10 X 1000/(5 X 
0°)=200ps。 

对 于 定时 查询 和 独占 查询 方式 ,CPU 传送 1000B 所 用 时 间 至 少 为 1000 X (60 十 1000) X 
三 1060000ns 二 1060ps; 对 于 中 断 方式 ,CPU 传送 1000B 所 用 时 间 为 1000X (2 十 1200) X1= 
202000ns 王 1202ws。 上 述 三 种 方式 下 ,CPU 所 用 的 时 间 都 比 设备 所 用 时 间 长 得 多 ,也 即 设 
备 的 传输 比 CPU 的 处 理 快 得 多 ,因而 发 生 数据 丢失 。 因 此 ,这 三 种 方式 都 不 能 用 于 该 设备 
的 I/O 操作。 对 于 DMA 方式 ,CPU 传送 1000B 所 用 时 间 为 2000X1==2000ns 二 2ps, 占 整 
个 CPU 时 间 的 百分比 为 2/200 二 1%。 说 明 可 以 使 用 DMA 方式 ,不 过 由 于 外 设 传输 速度 
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加 快 ,使 得 CPU 频繁 进行 DMA 预 处 理 和 后 处 理 ,因而 CPU 的 开销 从 0. 01% 上升 到 
下 本 网。 

(6) 对 于 字符 型 设备 ,在 定时 查询 方式 下 ,其 数据 传送 过 程 如 图 8. 12 所 示 。CPU 可 以 
每 隔 0.02ms 查询 一 次 ,这 样 总 是 在 第 一 次 查询 时 就 发 现 就 绪 , 马 上 启动 设备 进行 下 一 个 字 
节 的 传送 ,并 读 取 和 处 理 当 前 字 节 。 因 此 ,CPU 传送 1000B 所 用 时 间 至 少 为 1000 X 
(1000 十 60)X1 二 1060000ns 二 1060ps 三 1. 06ms, 而 设备 传输 1000B 所 用 时 间 为 0. 02 X 
1000 王 20ms, 因 此 占用 CPU 时 间 的 百分比 至 少 为 1.06/20=5.3%。 
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图 8.12 字符 型 设备 定时 查询 方式 下 的 I/O 过 程 
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在 独占 查询 方式 下 ,其 数据 传送 过 程 如 图 8. 13 所 示 。 第 一 个 字 节 传送 在 第 334 次 读 取 
状态 查询 时 检测 到 就 绪 , 随 后 启动 外 设 ;在 外 设 工作 的 同时 ,查询 程序 用 1000 个 时 钟 周期 进 
行 相应 的 处 理 , 然 后 周而复始 地 进行 查询 ,因为 (20000 一 1000)/60=316.7, 所 以 ,对 于 后 面 
的 999B, 每 当 进 行 到 第 317 次 状态 查询 时 发 现 就 绪 ; 对 于 最 后 一 个 字 节 , 外 设 就 绪 后 CPU 
还 需要 1000 个 时 钟 对 其 进行 处 理 。 因 此 ,在 1000B 的 读 取 过 程 中 ,CPU 用 在 该 设备 的 IO 
操作 上 的 时 间 为 (334 X 60 十 999 X (1000 十 60 X317) 十 1000) X 1= 2002102ns = 
20.02102ms。 这 种 情况 下 ,该 设备 的 1/0 操作 占用 CPU 的 时 间 为 100%。 
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图 8.13 字符 型 设备 独占 查询 方式 下 的 1/O 过 程 


在 中 断 方式 下 ,其 数据 传送 过 程 如 图 8. 14 所 示 。CPU 传送 1000B 所 用 时 间 为 
1. 202ms。 因 为 中 断 响应 需 2 个 时 钟 周期 ,并 且 中 断 服务 程序 执行 了 20 条 指令 后 开始 启动 
外 设 ,所 以 外 设 每 次 中 断 请 求 的 时 间 间 隔 为 (2 十 20X5)X1 十 20000 王 20102ns, 传 送 1000B 
所 用 时 间 为 1000X20102 二 20102000ns 二 20.102ms。 因 此 ,中 断 方式 下 CPU 占用 时 间 的 百 
分 比 约 为 1. 202/20. 102 一 5. 98%。 
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8.14 字符 型 设备 中 断 方式 下 的 1/O 过 程 





互 过 及 输入 葵 出 组 织 


(7) 根据 对 各 种 数据 的 分 析 , 可 以 得 到 以 下 4 个 结论 : 

@ 对 于 查询 方式 ,定时 查询 比 独占 查询 的 CPU 利用 率 高 ,但 是 ,定时 查询 的 时 间 间 隔 
必须 和 外 设 的 数据 传输 率 和 接口 缓存 情况 相 匹配 。 

@ 对 于 快速 设备 ,因为 查询 方式 和 中 断 方式 的 CPU 开销 大 ,使 得 CPU 来 不 及 处 理 外 
设 传输 的 数据 而 导致 数据 丢失 ,因而 快速 设备 不 能 采用 这 两 种 方式 。 

@ 对 于 块 传送 设备 ,因为 不 需要 每 个 字 节 都 启动 一 次 外 设 , 所 以 ,传送 相同 字 节 个 数 所 
用 的 时 间 比 字符 型 设备 的 时 间 短 。 例 如 ,对 于 1000B 的 传送 ,独占 查询 方式 下 , 块 传送 设备 
的 时 间 是 20. 00104ms ,而 字符 型 设备 是 20. 02102ms; 中 断 方式 下 , 块 传送 设备 的 时 间 是 
20ms ,而 字符 型 设备 是 20. 102ms。 

@ 外 设 速度 越 快 ,CPU 用 于 外 设 IO 操作 的 时 间 所 占 比例 越 大 ,因此 ,对 于 快速 设备 ， 
应 尽量 减少 CPU 介入 1/O 的 程度 ,也 即 采用 DMA 方式 更 合适 。 

补充 说 明 : 在 计算 CPU 占用 时 间 百 分 比 时 也 可 用 另 一 种 方法 。 例 如 ,对 于 (3) 中 断 方 
式 的 计算 ,可 以 先 求 出 一 秒 内 该 外 设 请 求 的 中 断 次 数 为 1/(1B/50kB) 二 50k, 然 后 得 到 一 秒 
内 CPU 用 于 数据 1/O 的 时 钟 周期 数 为 50X (2 十 1200)=6.01X107 ,因此 在 该 设备 传输 过 
程 中 ,CPU 用 于 该 设备 IO 操作 的 时 间 占 整个 CPU 时 间 的 百分比 为 6. 01 X 107/10 = 
6.01%。 
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